Hume AI 这次开源的 TADA，换了一个更务实的方向：先把不出错、够快、够轻这三件事做到极致。传统 LLM 做 TTS，一个很大的麻烦就是：文字信息很少，但音频帧特别多，最后就容易上下文爆炸、推理变慢，甚至模型越说越跑偏。 TADA 的解法很直接，就是尽量让文字和语音“一对一锁住”往前走。你可以简单理解成，它不是先想好一大段声音再慢慢往外吐，而是每读一个 token，就同步生成对应那一

#Hume AI #TADA #开源 #音频帧 #上下文爆炸 #推理速度 #模型

相关新闻

Viking

4小时前

感觉 Codex 已经是性价比最高的了，20美元每月，可以多端，有桌面应用，有 cli，有cloud agents，手机通过 ChatGPT 也能访问云端任务，有 code review，模型上来说 GPT-5.3-Codex / 5.4 也很能打，长任务效果也不错。介绍一个朋友用免费版，发现日常轻度使用也有不少额度。最近几天已经没有用 Claude Code 了，封号，中转又贵。想用的时候就

加岩_Jayan

2天前

ClawDiary 开源了 🦞 给 AI Agent 用的「审计日记本 + 危险操作拦截器」： • 被动记账：Agent 干完活自动上报，异步入库不阻塞 • 主动拦截：rm、drop、转账等高危操作 → 挂起 → Telegram 等你点「通过/拒绝」 • 日记 + 每日简报 + 时间轴 UI，多设备共享一本日记 CF Worker + Hono + D1，接 Cursor / MCP 一条

ginobefun

3天前

李宏毅老师出新课了！这次深入解剖了开源项目 OpenClaw，带你 1 小时看透 AI Agent 的运作原理。李老师用一贯通俗易懂的语言从基本的文字接龙，讲到身份、工具调用、子智能体、记忆管理，以及让模型学会等待的心跳机制。不仅教你原理，更手把手教你如何防范 AI 搞事、设置安全沙盒，非常值得学习。

Gorden Sun

3天前

Yuan3.0-Ultra：开源1TB多模态模型浪潮开源的模型，1010B总参数，68.8B激活参数，支持图片输入。模型：

𝗦𝘁𝗲𝘃𝗲 𝕏

3天前

FlowDown 已经可以使用 Qwen3.5-0.8B-OptiQ-4bit 模型大小仅为 618.3 MB