今年 8 月,Meta 公司推出了其多模态人工智能翻译模型 SeamlessM4T,该模型支持近 100 种语言的文本和 36 种语言的语音。现在该模型更新了“v2”架构,Meta 将其称之为“Seamless Communication(无缝沟通)”模型,能够让对话翻译更加自然和富有表现力。
两个新功能中的第一个是“SeamlessExpressive”,顾名思义,该功能可以将你的语气转移到翻译后的语音中,包括音调、音量、情感色彩(兴奋、悲伤或低语)、语速和停顿。考虑到目前翻译后的语音一般听起来都很机械,这一突破还是非常值得期待的,无论是在我们的日常生活中还是在内容制作中,都有很大的帮助。目前其支持的语言包括英语、西班牙语、德语、法语、意大利语和中文,不过在IT之家撰写本文时,演示页面缺少意大利语和中文。
第二个功能是“SeamlessStreaming”,可以在说话者仍在讲话时开始翻译,从而让其他人更快地听到翻译。虽然仍有不到两秒钟的短暂延迟,但至少不必等到对方说完一个句子。据 Meta 公司称,最大的挑战在于不同语言有不同的句子结构,因此他们必须开发一个专门的算法来研究部分音频输入,以决定是否有足够的上下文开始生成翻译输出,或者是否继续倾听。
目前 Meta 还没有透露公众何时能够使用这些新功能,但可以期待未来 Meta 将它们集成到其智能眼镜中,使其更加实用。
文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。
奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。
“以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。
华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。