0 关注者

2周前

阿里这次把 TTS 的玩法直接往前推了一大步。 Qwen3-TTS 新拆出来两条很“产品化”的能力线：一个是 Voice Design（VD-Flash），一个是 Voice Cloning（VC-Flash）。 VD-Flash 本质上是在做一件事：你用自然语言“描述一个声音”，模型就能把这个声音捏出来。不用选预设音色，不用调一堆参数，直接说“像纪录片旁白一样沉稳”“有点傲娇的少女语气”

热门新闻