微软昨晚开源新模型：VibeVoice-1.5B TTS，可一次生成90分钟语音、多人对话效果听起来质量很高，在说话人一致性和自然轮转上都非常不错 VibeVoice能生成90分钟连续语音，支持4个不同说话人，对像播客这种长篇音频内容生成比较实用基于Qwen2.5-1.5B理解上下文和语义，有两个连续语音分词器，这两个分词器以 7.5Hz的超低帧率运行，在保证音频质量的同时，提高了计算效

#微软 #VibeVoice-1.5B TTS #开源模型 #语音生成 #多人对话

相关新闻

Inty News

13小时前

微软隆重推出 Critique，M365 Copilot 中全新的多模型深度研究系统。可以同时使用多个模型来生成最佳的回复和报告。

蓝点网

1天前

由于出现循环安装问题，微软已经撤回 Windows 11 KB5079391 号可选更新，该更新会在安装时出现 0x80073712错误代码。在推送后大约 2 小时微软就发现问题并将其撤回，微软表示为避免影响更多用户的正常使用，在调查期间已经暂时限制这个更新的可用性。查看全文：

勃勃OC

2天前

微软AI豪赌拖累标普，科技股集体跳水纳斯达克100指数较10月高点跌逾10%，正式进入技术性回调区间。微软一季度跌幅达25%，剑指2008年以来最惨季度表现。市场担忧的核心只有一个：1460亿美元的AI数据中心Capex，短期内看不到回报。Azure增速放缓，Copilot试用转化率仅3.3%——钱烧出去了，商业化迟迟不来。多空分歧明显。空头预言标普将跌破6,000点；多头则死守两个信

Darren北美投资

2天前

微软目前PE是22，低于它的历史平均PE。2027前瞻PE已经跌破20。营收增长17%，EPS年度增长接近20%。作为微软这个体量的公司，这个增长速度还是非常不错的。毛利率超过50%，净利率接近40%，印钞机的水平。虽然资本支出扩张加上AI的担忧引发软件行业集体抛售，但微软现在的价格的确不错，长期基本面也没什么问题。

勃勃OC

4天前

The Information: 微软冻结云计算及销售部门的招聘