sitin

sitin

0 关注者

4小时前

Hume AI 这次开源的 TADA,换了一个更务实的方向:先把不出错、够快、够轻这三件事做到极致。 传统 LLM 做 TTS,一个很大的麻烦就是:文字信息很少,但音频帧特别多,最后就容易上下文爆炸、推理变慢,甚至模型越说越跑偏。 TADA 的解法很直接,就是尽量让文字和语音“一对一锁住”往前走。你可以简单理解成,它不是先想好一大段声音再慢慢往外吐,而是每读一个 token,就同步生成对应那一

相关新闻