由 NCMMSC 2025 组委会发起,清华大学、北京邮电大学、suncitygroup太阳官方网站、语音之家共同主办的第三届中文连续视觉语音识别挑战赛 CNVSRC 2025 正式启动,诚邀参与报名。
- 任务设置
-
T1:多个说话人视觉语音识别 (Multi-speaker VSR)
-
T2: 特定说话人视觉语音合成 (Single-speaker VTS)
-
固定赛道仅允许使用CN-CVS, CNVSRC(CNVSRC包括CNVSRC.Single.Dev和 CNVSRC.Multi.Dev ), CN-CVS2-P1, CN-CVS3数据集即各任务发布的开发集作为训练集,旨在验证算法的先进性。开放赛道则可以使用任何数据进行训练,旨在验证当前技术能够达到的性能上限。清华大学提供固定赛道上的基线系统代码,供参赛者作为参考。
-
- 参赛方式
CNVSRC 2025 对任何个人和机构开放。目前,竞赛官网已经启动并接受报名。关于竞赛规则、时间节点等更多信息,可扫描下方二维码进入竞赛官网,或在浏览器中访问网址。
[1] Chen C, Wang D, Zheng T F. CN-CVS: A mandarin audio-visual dataset for large vocabulary continuous visual to speech synthesis[C]//ICASSP 2023-2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE, 2023: 1-5.
[2] Chen C, Liu Z, Li X, et al. CNVSRC 2023: The First Chinese Continuous Visual Speech Recognition Challenge[C]//Proc. Interspeech 2024. 2024: 1930-1934.
[3] Liu Z, Li X, Chen C, et al. CNVSRC 2024: The Second Chinese Continuous Visual Speech Recognition Challenge[J]. arXiv preprint arXiv:2506.02010, 2025.