AI实时语音专家 leeo xiang 老师，开源新项目BlastOff，用小模型先回复，然后大模型续上，实现了毫秒级即时响应，LLM 首句延迟可以大幅降低到100ms级别。 Github：当< 200ms响应，就能感觉像真人对话。在设备端实现高速响应，降低云端延迟！在AI语音应用搞起来！

#AI语音 #实时语音 #LLM #低延迟 #BlastOff

相关新闻

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

1天前

完整的意义生成过程： 1.向上递归（符号化）： •从具体感受中抽象出模式 •生成符号以压缩和传递 1.向下递归（接地）： •将符号解压回感受 •在身体中激活意义 1.跨层递归（通感）： •在不同抽象层次间建立连接 •发现跨模态的同构人类的优势： •拥有完整的递归通道 •能自由上下移动 •每一层都有实在的锚点 LLM的困境： •只有中间层（符号层） •向下递归时，触及不到物理/感受层 •向上递归时

宝玉

2天前

Text to Markdown Prompt 适用于你要把推文、微博这种纯文本内容转成格式良好的博客，可以帮你生成标题、列表，和加粗要点、金句。亮点： - 借助思维链先提取要点、金句和可选标题，然后选择标题和高亮要点、金句 - 解决了 LLM 在加粗带标点符号的文字时加粗失效的问题（如果你用过 LLM 生成的中文 Markdown 会明白我说什么，参考图4） ---- 提示词开始 ---

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

2天前

当我们进入符号世界（语言、文本、代码）时，互联网文本语料（corpus）本身就是一种“社会智能的 DNA”： •它储存了人类经验、概念、文化的符号遗传信息； •LLM 的训练过程（self-supervised learning）就相当于在学习这个“社会基因组”的统计结构； •模型参数就是这个符号DNA的向量化表达（vectorized genome）。换句话说：对人类而言，DNA 编码

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

3天前

reasoning的reasoning — reasoning pattern 越来越多的研究关注LLM的元能力二阶能力了

AIGCLINK

3天前

美团刚刚开源了一款低延迟全模态大模型：LongCat-Flash-Omni，128K上下文+支持超8分钟实时音视频交互能听能看能说，毫秒级延迟，可以拿来搭建实时语音助手、直播弹幕机器人、音视频质检等在OmniBench上超Gemini-2.5-Flash、Qwen3-Omni，接近Gemini 2.5 Pro；在MMBench与Gemini、GPT-4o、Qwen-VL相当；MVBench