sitin 0 关注者 关注 2周前 阿里这次把 TTS 的玩法直接往前推了一大步。 Qwen3-TTS 新拆出来两条很“产品化”的能力线: 一个是 Voice Design(VD-Flash),一个是 Voice Cloning(VC-Flash)。 VD-Flash 本质上是在做一件事: 你用自然语言“描述一个声音”,模型就能把这个声音捏出来。 不用选预设音色,不用调一堆参数,直接说“像纪录片旁白一样沉稳”“有点傲娇的少女语气” 前往原网页查看