Google发布Gemini 3.5 Live Translate 支持70余种语言的实时语音翻译新模型 - Google 谷歌 (opens in new tab)
Google介绍称,其机器翻译探索起步于 20 年前的早期机器学习实验,经过多年发展,如今Google旗下多种产品每月已经为数十亿用户翻译超万亿字词。Gemini 3.5 Live Translate 被视为在这一长期布局上的新一步,将“语言科技”进一步向“实时跨语沟通体验”延伸。Gemini 3.5 Live Translate 将率先在多条产品线中推开。对于开发者,该模型已通过 Gemini Live API 和 Google AI Studio 面向公众预览开放,便于在各类应用和服务中集成语音同传能力。对于企业用户,Google将在本月起于 Google Meet 中开启私测,帮助企业视频会议实现多语言实时语音翻译。对于普通用户,Gemini 3.5 Live Translate 将通过 Android 和 iOS 版 Google 翻译应用向全球逐步推送。在具体能力方面,Gemini 3.5 Live Translate 可以在语音流输入的同时直接进行处理,不需要用户事先手动配置语言选项,可以自动识别多种语言,并在嘈杂、不可预期的声学环境中保持相对稳定的表现。Google...
Read the original article