每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/
Meta最近发布了一批新的语言翻译模型。这些模型在翻译我们的话时,可以保持我们的说话方式不变。而且,你不必等到说完话才能得到翻译,语音输出几乎能实时跟上你的说话。
这里有四个模型:
SeamlessM4T v2 – Meta于八月发布的基础模型。
SeamlessExpressive – 一个用于保留语音到语音翻译中表达的模型。
SeamlessStreaming – 一个流式翻译模型,提供最先进的结果,延迟大约两秒。
Seamless – 将SeamlessExpressive、SeamlessStreaming和SeamlessM4T v2集成到一个模型中。
SeamlessExpressive目前能在英语、西班牙语、德语、法语、意大利语和中文之间的语音到语音翻译中保持语速、节奏停顿、情感和风格。SeamlessStreaming能在说话人仍在讲话时进行翻译。你可以在HuggingFace上试用这些模型,这些模型对非商业用途是开源的。
想象一下,在Instagram上使用无缝模型进行视频通话。你可以和世界上任何人聊天,英语不再是交流的障碍。另一个值得注意的点是,你可以构建算法来增强基础模型。例如,Seamless Streaming有一个算法,用于决定何时继续倾听,何时开始翻译,以处理不同语言中的不同句子结构。
这里去看更多 https://ai.meta.com/blog/seamless-communication/
原文地址:https://blog.csdn.net/2301_79342058/article/details/134750113
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.7code.cn/show_28070.html
如若内容造成侵权/违法违规/事实不符,请联系代码007邮箱:suwngjj01@126.com进行投诉反馈,一经查实,立即删除!