请在此添加图片描述

这是“甘蔗”。

请在此添加图片描述

客家话,叫“炸”;安徽人,说“fu jie”;浙江人,说“ge jiou”;四川人,说“干ze”……

请在此添加图片描述

这是“马路牙子”,有人说“道牙子”,但有人听成了“倒鸭子”。

“全世界都在说中国话”,但不一定每一种“方言”你都能懂。

还有“粤普”、“湘普”、“椒盐普”……要直面这些方言的交流,对你我是考验,对AI也是考验。

怎么让带有“乡音”的交流更顺点?今天,腾讯云出招了。

基于大模型能力,腾讯云ASR全新升级,推出了中文方言大模型与中文普通话大模型,让你说的话,能被AI更好地“听得懂、听得清、猜得准”,即使方言,也丝滑。

一个引擎,方言混战“听得懂”

精通23地方言,只是“洒洒水”。

更重要的是,腾讯云ASR能从容应对“方言混战”。

通过自研多语言混合识别引擎,在多种方言对话过程中,也能快速识别,无缝切换,一个引擎就搞定!

依托微信智聆实验室的技术,通过自研蒸馏算法,并结合伪标注技术下的半监督训练,腾讯云ASR可以高效通过已标注数据,学习未标注数据。

经过少量训练就能举一反三,少数民族的小方言,也能轻松拿捏。

大模型加持,语义识别“猜得准”

语音开黑时,对面战友说的是“你打野”还是“你大爷”?腾讯云ASR 也能秒懂。

在训练阶段,腾讯云ASR加入了大语言模型LLM,基于5到7倍于过往的参考数据量,可以通过上下文语义和大数据提取意图,提升识别准确率。

对于读音相似的词,也能选出哪一个是“正解”。对于特殊场景或专业术语,AI也不再瞎猜。

自研算法,过滤噪声“听得清”

在语音转文字过程中,风声、车流声等各种声音,会降低AI识别的精准度。

我们将系统放在充满方言和外语的环境中自主学习,并不断加入噪音、调低音量,优化算法,训练ASR抗干扰的能力

经过专业的“耳力”训练,腾讯云ASR可以自动过滤“噪音”,扫清各种“理解”障碍。

目前,腾讯云ASR已经在微信、王者荣耀等腾讯内部产品以及外部不同行业持续落地,覆盖录音质检、会议实时转写、语音输入法等多个场景,产品单日调用量达到百亿次,单月服务的内外部企业客户数达到数千个。

听得懂、听得清、猜得准,大模型正在让AI成为我们生活工作中的“好翻译”,当中断的对话由ASR再次衔接,人与人之间的交流也变得更加无阻。

目前,腾讯云语音识别大模型已正式上线,点击「阅读原文」了解详情与功能体验!

请在此添加图片描述

企业用户需求可扫码登记,方便为您建立需求快速通道!

文章来源于腾讯云开发者社区,点击查看原文