sitin 0 关注者 关注 2天前 IndexTTS2 是 Bilibili 提出的一款新一代零样本语音合成(TTS)模型,其核心目标是实现高精度时长控制与高度自然的情绪表达,同时保持音色一致性,适用于视频配音、内容创作和多模态合成等场景。 核心突破与功能亮点 1.精准时长控制:可直接指定语音时长(精确到毫秒),确保与视频口型严格对齐。支持不设限的“自然时长”模式,适应不同场景。 2.音色与情感完全分离(核心创新):通过对抗训练 #IndexTTS2 #语音合成 #情感控制 #零样本 #Bilibili 前往原网页查看