CDSD:中文构音障碍数据库

📖

简介

我们提出了一个中文构音障碍数据库(CDSD),为构音障碍研究提供宝贵的数据资源。该数据库包括24名构音障碍患者的语音数据,在这些参与者中,其中一位额外录制了10小时的语音数据,其他人每人录制1小时,总共录制了34小时的语音数据。为了适应不同认知水平的参与者,我们的语料池主要由AISHELL-1数据集和中小学生演讲稿组成。当参与者阅读文本时,使用移动设备或ZOOM F8n多轨现场录音机录制。在本文中,我们阐明了数据收集和标注过程并提出了一种建立困难语音识别基线的方法。此外,我们还利用其中一名参与者额外的10小时语音数据,进行了一个特定人构音障碍语音识别实验。我们的研究结果表明,通过广泛的数据驱动模型训练,微调有限数量的特定个体数据,在特定人构音障碍语音识别中产生了值得称赞的结果。然而,我们观察到不同发音困难者在识别结果上的显著差异。这些见解为特定人构音障碍语音识别提供了有价值的参考点。

⬇️

如何下载

如需下载CDSD语音数据库,请下载并仔细阅读license agreement,通过以下链接填写您的个人信息,并提交签字版license agreement。

点击下载license agreement

点击这里进行申请
📜

参考文献

M. Sun, M. Gao, X. Kang, S. Wang, J. Du, D. Yao, and S.-J. Wang, “CDSD: Chinese dysarthria speech database,” arXiv e-prints, arXiv:22310.15930, 2023. https://doi.org/10.48550/arXiv.2310.15930.


联系MELAB: melab@psych.ac.cn