WAP手机版 RSS订阅 加入收藏  设为首页
新mg官网
当前位置:首页 > 新mg官网

新mg官网:非母语儿童语言的数据资源相对匮乏

时间:2021/4/14 10:06:25   作者:   来源:   阅读:3   评论:0
内容摘要:说非母语的儿童。由于儿童言语的内在差异,包括生理差异(如儿童声道长度较短)、认知差异(如语言习得水平低、语法逻辑错误、发音前命题错误、发音不完整、混合语言)等情况,而行为差异(如儿童窃窃私语的习惯)等,使得一般的语音识别模型难以适应,这使得构建面向非母语儿童的语音识别系统更具挑战性。另一方面,非母语儿童语言的数据资源相...

说非母语的儿童。由于儿童言语的内在差异,包括生理差异(如儿童声道长度较短)、认知差异(如语言习得水平低、语法逻辑错误、发音前命题错误、发音不完整、混合语言)等情况,而行为差异(如儿童窃窃私语的习惯)等,使得一般的语音识别模型难以适应,这使得构建面向非母语儿童的语音识别系统更具挑战性。另一方面,非母语儿童语言的数据资源相对匮乏,使得传统的声学建模方法难以在这种场景下工作。

为了应对上述挑战,美好未来的AI语音团队在实际教育场景中积累的丰富经验基础上,充分结合儿童语音的生理特征和语言认知,尝试了不同的解决方案。例如,在数据和特征层面,采用不同学龄儿童规范化、非语言符号共享、非流畅语料库生成、分层语言模型构建、半监督语音活动检测等方法进行针对性优化;在层次声学建模中,采用深度多流CNN和无监督预训练相结合的方法,大大提高了低资源场景下非母语儿童的语音识别性能。

在比赛中,好前程最终提交的系统以第二名的绝对优势获得了冠军。该系统更适合儿童语音识别场景,识别结果更准确。更重要的是,该技术的进步和应用可以在很大程度上避免一般模型对儿童语音的不准确识别。对孩子的自信心和学习热情造成了消极的影响。



相关评论

本类更新

本类推荐

本类排行

本站所有站内信息仅供娱乐参考,不作任何商业用途,不以营利为目的,专注分享快乐,欢迎收藏本站!
所有信息均来自:百度一下 (新mg官网_)