谷歌新发布的Gemini 2.5 Flash Exp Audio模型，是原生多模态模型，支持文本、图片、语音输入，支持文本、语音输出。输出的语音支持各种语气和声音，也能唱歌和RAP，虽然中文有时会有发音错误，但整体也非常不错了，ASMR的少女声音，让人感觉又恋爱了。下方视频第一段：少女ASMR 下方视频第二段：唱歌和RAP

#谷歌 #Gemini #多模态模型 #语音技术 #唱歌 #RAP #ASMR

相关新闻

Oasis Feng

15小时前

试了一下 Gemini 加持的 Google Spreadsheet，完全正确理解了我的需求并准确地完成了批量修改。之前弄这种间隔一列而且还在隐藏列中的公式调整简直就是体力活，自己机械操作这么十几列还挺容易出错。Gemini 简直堪称救星！🥹 就是现阶段这速度实在还有点慢…（Gemini 前后花了差不多一分钟才完成）

Michael Anti

16小时前

虽然Gemini说开放了香港IP，但至今为止，只是网页版能用，API依然封锁。

Robinson · 鲁棒逊

2天前

忽然想到我已经好久没有打开过gemini了好像查无此人了…… 相信不是我一个人

黄赟

2天前

一个最能体现你当下 AI Coding 水平的问题：你能让 codex，claude code, gemini cli 无人值守运行多长时间？注意⚠️：是无人值守，你可以去跑步，吃饭，睡觉，回来就拿结果的那种

歸藏(guizang.ai)

3天前

牛批，谷歌 Chrome 有竖向标签栏了启用方式，地址栏输入 chrome://flags/#vertical-tabs 启用后重启浏览器，然后在标签栏空白区域选择“将标签页移到侧边”