你是否遇到过这样的困扰:想观看海外直播、新闻发布,却因为缺少字幕而不得不放弃?花了大量时间找翻译工具和插件,结果要么设置繁琐、严重延迟、语言不全,要么字幕混乱串行。
近日,QQ浏览器电脑端「实时字幕」功能上线,依托腾讯云语音识别(ASR)和腾讯混元翻译模型,帮助浏览器用户更好地理解音视频内容。
//更快:低延迟输出,字幕不用等
过去看外语视频,字幕「慢半拍」很常见。尤其是在追直播、看比赛时,画面已经进入下一个环节,字幕还停留在上一句话,字幕输出总是跟不上节奏。
QQ浏览器「实时字幕」基于腾讯云语音识别能力,能够将声音迅速转写为文字,让字幕几乎与画面保持同步。对于职场人来说,这种低延迟尤为重要,学习外语课程或跟进培训资料时,每一个关键信息都不会错过。
腾讯云语音识别提供中英粤+多方言大模型语音识别、小语种大模型语音识别,支持百毫秒级响应。此外,热词和自学习模型等功能进一步提升识别准确率,在外语网课、多语种会议、海外影视等音视频理解场景应用广泛。
//更准:支持16种语言,字幕贴切自然
常规字幕工具往往只覆盖少数几种语言,翻译出来容易生硬跑偏,一旦遇到小语种或强口音,基本就只能放弃。
QQ浏览器「实时字幕」,依托腾讯云语音识别和混元翻译模型支持16种主流语言的识别和翻译,覆盖英语、法语、德语、日语、韩语等。打开视频开启实时字幕功能,选择源语言和目标语言,即可自动转写并实时翻译到目标语言。
需要严谨信息的学术、新闻等场合,还可以开启「原文+译文」对照,一边看原文表达,一边核对译文语义,既准确又贴合语境。
相比传统的机器翻译,基于大模型的翻译对对话背景、上下文内容以及综合翻译需求有更深度的了解,能够提供更加准确的翻译。
在8月底结束的国际计算语言学协会(ACL)WMT2025比赛中,腾讯混元Hunyuan-MT-7B(参赛名称:Shy-hunyuan-MT)拿下了全部 31个语种比赛中的30个第1名,处于绝对领先地位。
目前,腾讯混元翻译模型已经接入腾讯会议、企业微信、腾讯海外客服翻译等多个业务产品,助力产品体验提升。
腾讯云语音识别(ASR)__:https://cloud.tencent.com/product/asr?Is=sdk-topnav
腾讯混元翻译__:https://cloud.tencent.com/document/product/1729/113395