当前位置: 领跑汽车在线 > 资讯 > 正文

中国首个支持30种方言混说语音大模型发布

中新网   醉言   2024-05-25 21:37   阅读量:19956   

正在为传承语言文化注入全新生命力。中国运营商发布首个支持30种方言混说语音大模型。

25日,在第七届数字中国建设峰会上,中国电信人工智能研究院发布业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,打破单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温州话等30多种方言,是国内支持最多方言的语音识别大模型。

中国幅员辽阔,“百里不同俗,十里不同音”。各种方言语法语音特征各不相同,传统的方言研究依赖于调查者主观感知标注,人力工程量巨大且难以系统标注。而AI能够更高效、系统地对方言进行整理归纳,对方言保护和传承意义重大。

构建高质量方言数据库,是方言保护和研究的基础。中国电信人工智能研究院已构建超过30种、超30万小时的高质量方言数据库,方言数据库在丰富性和高质量等层面均居于业内前列。

此外,中国电信研发团队首创“蒸馏+膨胀”联合训练算法,解决超大规模多场景数据集和大规模参数条件下,预训练坍缩的问题。

声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。

最新资讯
  • 试驾2022款长安逸动PLUS试驾2022款长安逸动PLU
  • 首款搭载CTB技术的e平台3.0车型海豹开启预售,预售价格21.28万元起首款搭载CTB技术的e平台3
  • 特斯拉第三大个人股东呼吁回购150亿美元股票特斯拉第三大个人股东呼吁回购
  • 斯柯达与Etnetera成立合资企业,专攻电动汽车软件领域斯柯达与Etnetera成立
  • 阻击奥密克戎 天津开启全员核酸检测阻击奥密克戎 天津开启全员核
  • AITO问界M5发布15天后我们知道了它的成功密码AITO问界M5发布15天后