品玩12月11日讯,Google今日宣布推出Gemini 2.5 Flash与Pro Text-to-Speech(TTS)预览模型的重大更新,替代今年5月发布的旧版。
新模型在表达力、语速控制及多说话人一致性方面显著提升,支持更精准的风格指令响应、上下文感知的节奏调节,并可在24种语言中保持角色声线稳定。
该技术已应用于Wondercraft等平台,助力其多角色对话与导演模式功能,实现自然语音生成。用户现可通过Google AI Studio和Playground体验新版TTS能力,适用于有声书、教学视频、营销内容等高保真语音场景。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 3561739510@qq.com 举报,一经查实,本站将立刻删除。!
本文链接:https://www.ihuihong.com/article-17244-1.html