#基础模型

2周前
推荐阅读 20250617 ① 📈 2025 年中 AI 共识:技术、产品与资本新格局 - 2025 年被行业确立为 “Agent 之年”,但底层技术的发展并非简单的替代,而是 L2 推理模型与基础模型能力的持续深化。 - AI 行业呈现新版 “安迪-比尔定律”,Agent 执行任务时长的增速远超算力成本下降的速度,如何衡量与评估 Agent 能力的 benchmark 设计已成难题。 - AI 产品交付逻辑正从 “敏捷开发” 转向 “雕刻艺术”,即从一个无所不能的大模型中,通过限定边界来交付稳定可靠的结果。   📖 小宇宙: PPT 下载: AI 转录: ② ⚔️ 国产大模型同日竞技:MiniMax-M1 vs. Kimi-Dev-72B - MiniMax-M1 拥有全球最长的 100 万 token 上下文窗口和最强的智能体工具使用能力,并能轻松生成交互式 Web 应用和游戏。 - 月之暗面 Kimi-Dev-72B 专攻编程,在代码生成权威基准 SWE-bench Verified 上取得了全新的 SOTA 记录。 - 两者均采用大规模强化学习进行优化,并已开放模型权重,为开发者提供了强大的新工具。   📖 详细: ③ 🤖 LangChain 继续探讨热门话题:多智能体系统,建还是不建? - 本文深入分析了 Cognition 与 Anthropic 两篇关于多智能体的文章,尽管标题看似对立,核心洞见却高度一致。 - 强调 “上下文工程” (Context Engineering) 是构建智能体应用的第一要务,它超越了传统的提示工程 (Prompt Engineering),是系统成功的关键。 - 揭示了多智能体架构的核心原则:系统更适用于并行的“读取” 密集型任务(如研究),而非易产生冲突的“写入” 密集型任务(如编码)。   📖 详细: ④ 🧠 腾讯实习生硬核总结:Agent 与 RAG 入门与实战 - 亲历腾讯 IEG/WXG 项目,作者用“血泪 Debug 经验”为 AI 新手绘制 Agent 与 RAG 的入门路线图。 - 用“人话说明书”讲透两大技术核心,从 RAG 的检索增强生成到 Agent 的规划、记忆与工具使用。 - 一站式解决 AI 应用中的“幻觉”与“空谈”问题,帮助开发者从青铜快速上分,实现从理想到落地的跨越。   📖 详细: ⑤ 🧠 给 Staff+ 工程师的战略思维指南 - 战略思维是一种心态,而非单纯的技能,是连接技术执行与商业愿景的关键桥梁。 - 提供一套可落地的战略框架:从诊断与洞察出发,建立指导原则,并转化为连贯的行动 。 - 强调领导者需为工程师提供充分的业务与技术背景,并确保他们在关键决策桌上拥有一席之地。 📖 详细:
2周前
这两天网上对苹果AI的吐槽比较多,比如有个朗朗上口的梗是“别人冲AI,苹果搞UI”。但和主流观点不太一样,我认为WWDC25苹果在AI上做了件大好事:给AI的实际应用落地全面科普筑基。 苹果在AI基础模型的实力上远未达到业界顶尖水平,这是客观事实。但这次苹果在发布Foundation Models Framework的同时,花了大量功夫做开发教学。一开始我以为这个“基础模型框架”就是把苹果那个30亿参数的本地模型开放出来给开发者们用,可看完官方的三个公开课之后,我发现这套教程、文档、用例,才是苹果真正的诚意之作! 苹果做的事就是,现在模型能干什么、该怎么用、可能出现哪些问题,都给讲清楚、处理好了。举个细节点的例子,我一直知道大模型有system prompt和user prompt,但一直没深究过,看了苹果的教程,才知道原来system prompt更适合写角色设定之类的提示词,因为大模型都会被训练得更遵循system prompt。再比如,AI输出慢大家都知道,但只有苹果专门出来讲了下怎么用动画、设计来消解这些迟滞感。还有像对话太长了怎么办,“工具调用”到底是怎么个流程,这样的例子还有很多。无论是不是苹果系开发者,我都强烈建议去白嫖一下苹果构建的这套知识体系,对落地自己的AI应用肯定大有助益。 指路,三个公开课视频: 1. WWDC25: Meet the Foundation Models framework (YouTube) 2. WWDC25: Deep dive into the Foundation Models framework (YouTube) 3. Code-along: Bring on-device AI to your app using the Foundation Models framework ()