Leo Xiang2025-06-17 02:38:35网络延迟已经超过推理延迟,对于在构造realtime agent的公司来说要及早构建自己asr/llm/tts的闭环,只有在需要强推理的情况下才调用外部大模型。
马东锡 NLP 🇸🇪2025-06-16 03:27:53看了一些 Agent 项目,忽然发现一个问题。 目前 LLM Agent 通过 tool call 调用下游 API,不管是 REST 还是 gRPC,这套最佳实践诞生 Agent 之前,交互单元仍以“资源”或“函数”为核心,主要面向人类开发者。 在 Agent 项目中,API 接口应从“数据 - 方法” 转变到 “意图 - 动作”,成为 Agent 的行动指南。Agent 真正需要的是可直接
orange.ai2025-06-14 18:22:07看 Will 的智能体产品数据分析,里面有非常多有趣的数据 首先是国家数据,中国美国印度是三个 AI 用户大国就不提了。 其他国家里,最常见的几个是: 巴西、埃及、日本、韩国、英国。这几个市场都值得注意。 其中 Fellou 的传播最为诡异,突尼斯竟然排到了第五。 从智能浏览器看,Fellou 之前的热度非常高,最近 Dia 才开始做增长,两者现在的流量差不太多。 另外意外的发现,Devin 的流
orange.ai2025-06-14 08:41:40做 Agent 研究的不要错过今天 Anthropic 发布的关于多智能体系统的文章。 ## 什么是多智能体系统? 多智能体系统是指由多个AI代理(如LLM)协同工作、并行使用工具来完成复杂任务的系统。 与单智能体相比,多智能体系统能同时探索多个方向,分工明确,提升效率和覆盖面,尤其适合开放性、动态变化的问题。 ## 为什么要用多智能体系统? 在过去的十万年里,人类个体的智能水平不断提升。
马东锡 NLP 🇸🇪2025-06-14 04:03:30「 Parallel Reasoning, LLM」 Multiverse: Your Language Models Secretly Decide How to Parallelize and Merge Generation Multiverse:让模型自己决定“何时拆分、如何并行、何时合并”,把经典 MapReduce 范式内化到生成过程中。 “在无限的多元宇宙中,每一种可能,终将在