构音障碍语音会显著影响患者的社交沟通能力,而构音障碍语音识别(DSR)仍具有挑战,关键原因之一是高质量数据稀缺。 CDSD 是目前规模最大的中文构音障碍语音数据之一,包含 44 位说话人、总计 133 小时录音。 基准实验显示最佳字符错误率(CER)为 16.4%,并通过额外人工实验对比展示其研究价值。
提交成功!请等待审核邮件。