歸藏(guizang.ai) 0 关注者 关注 20小时前 谷歌新的 Gemini TTS 模型太牛逼了! 直接可以通过提示词去控制说话人的性别、语调、语气、某个词的读音、年龄。 你能想到的都能控制,根本不需要切换单独的语音模型! 我的 AI 互动漫剧应用终于是完全体了! 使用Nano Banana Pro动态地生成每个场景的图片,以及新的TTS生成每角色的独特的语音。 前往原网页查看