#Kimi

歸藏(guizang.ai)

5天前

Kimi 终于带来了他们的Agent 模式「OK Computer」，而且给了所有之前打赏过的用户提前体验的资格。从官方推文来看，这个Agent的定位是全栈助理，直接瞄准生产力场景：支持使用文件系统、浏览器、终端、代码编写、图片音频生成等 20 多种工具。支持完成调研、产品方案、交互设计和前端开发的完整过程，也就是一个产研合一的团队。而且这次依然是用的专门经过特定场景强化学习模型驱动的，可能上限比较高。我试了一下，先让他分析了一下最近阿里的股票表现，虽然我不懂炒股，但是页面的表格数据和图表可以说生成的相当专业和丰富了，还都是可交互的。然后让他创建一个购物网站，而且模拟了从展示到购物车到下单的多个页面，设计还行，就是下次可以内置个图标库，别老用 Emoji 当图标。最后让他创建了一个 PPT，这个结果挺惊喜的，设计风格和配图都跟我的北宋道教发展题目相契合，而且每一页PPT 的每一个元素几乎都支持编辑，比如颜色、字号、位置。甚至你可以主动插入图标素材或者表格，把一个简易 PPT 工具放到网页上了。看他们的介绍说未来会增加很多外部应用的连接，这样的话想象空间就大很多了。 Kimi这个团队是不是有点太爱摇滚了

#Kimi #OK Computer #agent模式 #全栈助理 #生产力工具

6天前

Kimi官方对OpenRouter上不同的供应商的 Tool Calling能力做了Benchmark，发现有些供应商提供的模型服务有较大问题。可能是推理Bug，也可能是不合理的量化。另外 1. 使用的2000条Tool Calling 测试集没有开源。 2. 可以在 OpenRouter配置中排除掉某些供应商。

#Kimi #Openrouter #tool calling #Benchmark #模型问题

歸藏(guizang.ai)

1周前

Kimi居然上了Agent会员服务！昨晚打开Kimi的时候，界面突然弹出了一封给打赏用户的感谢信。点开后，是给打赏用户的会员福利。你以前打赏的金额会在首次订阅Agent会员后全额返还，作为会员的时间。我试着冲了一个月，直接送了我九个月的会员，这也太好了！之前打赏过的朋友可以去看一下，顺便看看自己的打赏序号。说回会员，目前付费和免费用户主要区分还是Agent使用次数上，免费用户依然可以使用 kimi 的所有对话服务，只是深度研究Agent额度跟会员有区别。现有的功能不充会员一样用。新的会员服务命名还蛮有创意的，我查了一下是音乐节拍的单词： Adagio（慢板）对应的是免费版本。 Andante（行板）49 元中档订阅，更多的 K2 和深度研究额度，另外会送等额 API 兑换券。 Moderato（中速）99 元有更高的额度，支持深度研究并发，依然送等额 API 代金券。对比海外同档位是19美金的价格，国服还是有优势的。另外，海外还有一个 199 美元的会员等级 Vivace，多了一个高峰时段优先访问的权限。之前我也分享过关于 Kimi 的深度研究能力，基于专有模型的和基于常规模型的体验还是不太一样的。具体表现就是研究报告的搜索能力和专业度更强，可以输出更多观点认知类的研究发现，并非只是简单的信息罗列，没试过的朋友也可以去试试。

#Kimi #Agent会员 #会员福利 #深度研究 #音乐节拍

1周前

Kimi 有了商业模式刚刚竟然收到了一封 Kimi 感谢信，感谢我曾经打赏过它。原来 Kimi 上线了付费会员计划，会员可以使用深度研究 Agent 功能。之前打赏过的，买会员之后可以把打赏金额都全部抵扣成会员费，我都忘记打赏过多少了，只看到买一个月送9个月😂。还有个细节挺贴心：Kimi 的聊天一直是免费的，只有 Agent 功能才需要付费。这样不管是轻度用户还是深度研究用户，都能各取所需。终于，Kimi 也终于开始做Agent商业化了，毕竟今年 K2 模型和深度研究模型都非常给力，有商业化才能健康地发展。

#Kimi #商业模式 #付费会员 #Agent功能 #深度研究

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

1周前

重读最近张小珺对杨植麟和姚顺雨的访谈： KIMI除了继续探索长上下文的智商下降问题，K2还通过MUON优化提高token efficiency ，也尝试了agentic LLM方向，并表示模型能力需要RL激发但存在泛化的复杂问题，而基模预训练仍旧会提高交互的上限；而姚顺雨则表现了和杨植麟不一样的对语言的深刻哲学理解以及强调未来的交互创新是关键，甚至会改变这个世界，但我不确定是他本来的认知轨迹还是受到要去腾讯的影响。把二者放在一起看，又似乎各自都还缺了点什么？

#Kimi #杨植麟 #姚顺雨 #LLM #交互创新

砍砍@标准件厂长

2周前

我超 kimi k2 的 dataset 里头绝对有我的屎山这是第一次见一个模型能把我的信息说的这么多这么准确这算是进 2077 的数字生命线了 🤡

#Kimi #K2 #dataset #屎山 #数字生命线

2周前

看到昨天卡兹克发的公众号，感觉好笑又魔幻，淘宝卖 DeepSeek 无限使用满血版，结果下单后发现是发各大厂商的 AI 产品链接，里面有免费使用的 DeepSeek。最搞笑的是震惊的来了一句：Kimi你也有了？？？

#卡兹克 #DeepSeek #淘宝 #Kimi #魔幻

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

2周前

再听一下张小珺对zhilin的访谈，感觉KIMI在conversational阶段有点飘了，错过了推理阶段，现在在agentic阶段发力，期待在交互阶段和shunyu一较高下。

#张小珺 #zhilin #Kimi #conversational #Agentic

3周前

我在思考技术对意识形态的影响，也是不断和各AI商量。Kimi在这个时候总是给我惊喜，在其他中美AI按部就班地给出智造趋势会导致各种对政治影响的时候， Kimi毫不犹豫地点名这种趋势会导致技术利维坦：国家权力不再只是“资源配置”，而是深入到“运算配置”，政治秩序与技术秩序高度嵌合，形成技术利维坦。

AI技术引发伦理争议，专家呼吁加强监管· 106 条信息

#技术利维坦 #Kimi #AI #意识形态 #政治影响

3周前

我是多LLM一起用的，这几个月自己测试和排序的结果是，从聪明程度和质量上：o3 > kimi k2> Claude opus 4.1> doubao seed 1.6 > Gemini 2.5 pro = Grok 4。我的用途主要是思考、编程、知识等三个方面。资料查询方面 Gemini Deep Research 最好，各类 cc也能用。

#LLM #o3 #Kimi #Claude #Gemini

3周前

GLM、Kimi和Deepseek都开了cc协议，可以用Claude Code框架直接引用进行Vibe。我这几天测试下来的结果是：GLM表现不如意虽然它有价格上限，Kimi最好，Deepseek速度最慢，质量也可以。所以我现在Qwen Code和Kimi搭配着用。

AI编程工具激战：Claude Code、Gemini Cli崛起· 906 条信息

#GLM #Kimi #DeepSeek #代码框架 #测评

3周前

因为要尝试GLM和kimi版的cc，所以我用了cc-switch，的确效果很好，省得不断运行配置文件了。

AI编程工具激战：Claude Code、Gemini Cli崛起· 906 条信息

#GLM #Kimi #cc-switch #效率工具 #配置文件

3周前

新版本的kimi k2 0905 with CC： kimi-k2-0905-preview --- export ANTHROPIC_MODEL=kimi-k2-0905-preview export ANTHROPIC_SMALL_FAST_MODEL=kimi-k2-0905-preview

#Kimi #K2-0905-preview #ANTHROPIC_MODEL

1个月前

我有个习惯，平时看到好文章就随手扔到 Obsidian Clipping 文件夹里，也不分类，反正到周末再说。周末整理这些文章是我最头疼的事，经常拖着拖着就忘了。现在完全不一样了。只需要在 Claude Code 里说一句 "生成本周阅读总结"，CC 就会把这一周剪藏的所有文章全部读一遍，然后生成一份结构化的总结报告。我只需像皇帝批阅奏折一样快速浏览，就能知道哪些文章值得深读，哪些可以略过。提示词还能优化的更细节。目前用的是 Claude Code + KIMI 的穷人组合。

AI编程工具激战：Claude Code、Gemini Cli崛起· 906 条信息

#Obsidian #Claude Code #Kimi #阅读总结 #效率工具

1个月前

最近 kimi 在招人，我朋友组，感兴趣可以看下

#Kimi #招聘 #朋友

1个月前

OpenCUA：开源Computer-Use Agent框架 Kimi和香港大学联合开源的项目，适用于操作电脑的Agent框架，同时开源了用于操作电脑的模型OpenCUA 32B和OpenCUA 7B（基于Qwen 2.5 VL），目前得分最高的用于操作电脑的开源模型。项目地址：模型：

#OpenCUA #开源项目 #Agent框架 #Kimi #香港大学

1个月前

一个观察：为什么我说 cursor 的本质上就是二道贩子，因为如果你想做一个很强的 agent，定义一些自己的“高科技”tool。但如果这种 tool 是在训练模型的数据中没有相似的，也就是模型完全没见过这种模式的 tool，模型是很难正确调用这个 tool 的，因为 GPT 这种架构的泛化能力并不强。这就是为什么你看到 cursor 的 tool 都是模仿现有的 tool，比如 grep 这种模型已经见过格式和形式。如果你发明了一种特别高效特别强的 tool，那必须用大量的跟这个 tool 相关合成数据在训练的时候交互模型这个 tool 的使用方式。但靠 prompt 是教不会的。这也就是为什么在 kimi 公开的文档中，为了强化 k2 的 agent 能力，他们搞了一堆模拟真实 coder 会用的 tool 调用的输入和输出，让模型学会不同类型的 tool 大概是什么样的，才能强化模型在 agent 的场景的能力。 TLDR：好的 agent 必须搭配针对这个场景 fine-tune 过后的 model

#Cursor #agent #Tool #GPT #Kimi

1个月前

推荐阅读：大模型大逃杀：一山不容「六小虎」中国AI领域聚集了最多钱和人才的几家创业明星公司，为什么集体失意？摘录一段零一万物的：一开始，不少零一万物的早期产品核心成员，是为了做出“Super App”，才选择加入零一万物。一名知情人士记得，李开复承诺他们，公司会给予产品立项很高的自由度：“开复鼓励大家对Super App的形态进行自由探索，只要有好想法，公司就给团队和资源试水。” 这样的承诺为零一吸引了不少人才，包括在飞书工作过的曹大鹏和蓝雨川。很快，曹大鹏就做出了PopAi，一款在海外上线的AI办公工具。效果也不错——截止2024年3月，PopAi的ROI已经打正，每周付费的增长率达到了30-40%，高峰期ARR接近千万美元。这本是一场不错的胜仗。若是延续下去，PopAi会成为零一万物找到PMF（产品-市场适配度）的代表作，也会成为零一万物继续融资、维持生存的重要砝码。但不出一年，零一万物却戏剧性地暂时搁置了PopAi。原因也相当戏谑。2024年3月，月之暗面的产品Kimi在国内出圈，由于担心丢失国内市场，零一万物决定将产品的重心，从成熟的海外市场，转向国内。当月，零一万物的高管就拍板，复刻Kimi，在国内上线一款AI生产力工具“万知”——一款几乎每家AI公司都有的对话框产品。最终，被零一寄予厚望的“万知”，分走了PopAi的大部分人力和金钱。失去了迭代和营销的资源，PopAi急转直下，“付费平均每个月都跌20%”。就这样，零一在厮杀中反而丢掉了一个重要武器。更具戏剧性的是，被零一效仿的对手，月之暗面，其看似华丽的增长数据，也是用近乎饮鸩止渴的手段实现。 “内部对标的是全盛时期的小红书增长曲线。”月之暗面员工刘磊对“智能涌现”打了个比方：如果Kimi第一个月的正常增长达到了200万，下个月和下下个月就得达到400万和600万，“没有任何一款初期产品能够达到这样的指数型增长。” 为了达成不现实的数据指标，月之暗面只能选择激进的投流。在过去的2024年，Kimi的投放预算一度水涨船高。另有月暗的员工告诉“智能涌现”，投流的最高峰在2024年12月，预算达到了惊人的2亿元。只是，烧出来流量，需要靠不断迭代的产品力去承接。但Kimi团队忽略了这一点。 “Kimi只管花钱，但产品团队怎么和增长团队配合，怎么迭代功能去提高用户留存，完全没有概念。”上述员工直言，靠“长文本”出圈后，Kimi在2024年，几乎没有再造一个爆点功能，“维持原有的增长率，已经很不容易。” 这就是这场“六小虎”生存战的荒谬之处：他们将“超越对手”当做了核心目标，而正常的产品研发流程、健康的业务增长方法，都因为杀红了眼，统统被忽略。总结PopAi的成功，一名零一万物员工告诉“智能涌现”，关键在于匹配市场需求。但为了尽快上线，“万知”跳过了用户调研、竞品对比、产品形态规划。后来，万知这款没有差异化竞争力的产品，推出仅3个月后，就因成绩不佳停止了运营。并非没有人给高层敲响警钟。 “万知”和PopAi两款产品的负责人曹大鹏，并不是“万知”立项的支持者。相反，他是最反对的一个。不少PopAi团队成员，也对“万知”有所顾虑，原因在于国内工具类市场已经被Kimi占据的心智，彼时入局不是好时机。产品策略的不合，最终导致人才的出走。2024年8月，曹大鹏选择离职，随后辗转加入字节，出任AI视频生成工具“即梦”的产品负责人。一名专做高级人才招聘的猎头，曾在2023年给两家六小虎的高管提出建议，让他们尽快从大厂和创业者中找一位产品主理，去弥补产品基建的短板。其中一家小虎的产品经理，也曾形容在其中做产品的感觉为“刀耕火种”：“完全不成体系，连最基础的A/B Test（一种产品效果的测试方法），也没有人去搭建。” 事与愿违。两家企业拒绝猎头的口径如出一辙，“他们和我说，做产品相对做技术而言简单得多，只要做好技术，他们做产品也不在话下。” 六小虎往往都是一手做产品，一手做模型。最后，两家企业招人的预算，都用在了技术人才上。

#大模型 #零一万物 #PopAi #Kimi #内卷

砍砍@标准件厂长

1个月前

让 kimi 找了一下十年内 macOS 的更新和包大小感觉这几年的更新都不痛不痒的。。。

#macOS更新 #Kimi #不痛不痒 #近十年 #包大小

1个月前

我脑补今天国内开源大语言模型智谱、千问、Kimi、DeepSeek团队满怀期待的下载 GPT-OSS 使用后，一脸懵逼的问这玩意研发花了多少钱？？旁边人：数十亿美元研究的成果🤣

#开源大语言模型 #gpt-oss #智谱 #千问 #Kimi #DeepSeek #数十亿美元 #懵逼

2个月前

2025年7月绝对可以被称为，中国大模型的「安卓时刻」。就像 iPhone 改变了世界，但安卓真正普及了新时代体验。国产大模型 Kimi Qwen GLM连续一个月开源一系列模型，悄无声息地完成了「规模对等」「性能对齐」「成本反杀」的三连击。 Kimi K2 是 1T 参数 MoE 架构；Kimi-K2 与 GLM-4.5 能够在 Claude Code 运行并完成复杂软件开发。Qwen3-Coder 也在 openrouter 编程用量榜单排到第二。过去 AI 编程几乎只有 Claude 一个选择，完全不存在性价比平替，但在7月之后，局面被完全改变。好几家 AI 编程产品如 Cursor，Windsurf 以极快的时间上线了 Kimi 和 Qwen。这是一种「安卓时刻」的重演：不是因为硬件超越，而是因为足够便宜、足够好用、足够自由。不再需要巨头模型的 API 许可，就可以构建自己的全流程 Coding Agent；不再需要受制于欧美定价，可以自行托管运行专属的代码引擎。将超级 AI 的权力普惠化，并不是要打倒谁，而是给出另一个普世的选择。

#中国大模型 #Kimi #Qwen #开源 #AI编程

2个月前

怎么能知道元器里面这个模型是 kimi K1 还是 K2 🤔

#元器 #Kimi #K1 #K2 #模型

張小珺 Xiaojùn

2个月前

给大家整理了技术报告link：第一篇技术报告：Kimi K2: Open Agentic Intelligence 第二篇技术报告访谈：Introducing ChatGPT agent: bridging research and action 红杉访谈OpenAI：OpenAI Just Released ChatGPT Agent, Its Most Powerful Agent Yet 第三篇技术报告：Qwen3-Coder: Agentic Coding in the World 第四篇技术博文：AI代理的上下文工程：构建Manus的经验教训（作者：Yichao 'Peak' Ji）

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 524 条信息

#Kimi #ChatGPT Agent #Qwen3-Coder #AI代理 #技术报告

2个月前

笑死，感觉被某大模型厂商耍了，RNM退钱！诈骗营销！ Kimi 锐评：“1 万亿”是营销锚点，“3.89 亿”才是你摸得到的天花板。

#大模型 #虚假宣传 #Kimi #营销锚点 #差评

2个月前

用 API 跑 Claude Code 太贵，实测Kimi K2 一个星期下来也扛不住了哇。 agentic coding 目前看不到可行的API方案，只能期待梁神天神下凡用 DeepSeek v4 把价格打下来，解救众生。想省钱，开两个 Claude Pro 账号最划算，但怎么在两账号间切来切去？难道真准备两台电脑？求问大家怎么用两个账号跑 Claude Code，给点实操经验。我不想花Max的钱，2个pro的用量对我来说应该够了。

AI编程工具激战：Claude Code、Gemini Cli崛起· 906 条信息

#Claude #Kimi #DeepSeek #省钱攻略 #多账号管理