Orange AI

统计数据

353

文章

0

粉丝

0

获赞

2002

阅读

2周前

豆包2.0的图片推理能力强的有点吓人了… 你能光看图猜到这是哪里吗？（去过的先别说哈我问了 Gemini 的思考模式，它猜错了，提示它错了之后，第二次又猜错了，而且它只知道按图上的文字搜索来猜我又问了豆包新出的专家模式，它第一次也错了，我提示它错了，这时候，它突然进入了狂暴模式，思考了大概有几分钟，思维链条有上千字，又是分析城市地理，又是分析各个景点的街道方向，建筑特征，中间还调用了搜图工具来对比… 我看它的思维链里有好几次说出正确答案又都自我否定，感觉它也没戏了结果它最后竟然答对了… 我问他怎么猜的，它列了四个步骤，三个小细节验证，严丝合缝，毫无破绽这个照片是我自己拍的小众景点，网上也没有发过，能猜到这里我是真的有点佩服…

2周前

今晚谷歌可能要发布最新的图像模型 banana 🍌 flash 又便宜又快速，质量还有保证我们将在 Labnana 第一时间支持这个模型 ListenHub 用户也可以直接使用通过 Labnana 使用此模型，账户打通的哈

2周前

人与人之间的大多数的误会都是源于缺少一次真诚的沟通人很复杂，又很简单

2周前

年前发布的几个国产新模型的竞技场排名出来了排名最高的，没想到是第一次打榜的...豆包（Seed 2.0） Seed2.0不仅拿下了国内综合第一，还在全球总榜里冲进了前10。其他几家新模型，GLM5、文心5、Qwen3.5、Kimi K2.5，紧跟着排在了16 17 18 19 名。特别值得一提的是，Seed2.0视觉能力更是仅次于 Gemini 的三个版本，排名全球第4。考虑到Seed2.0比 Gemini 的输入成本低5倍左右，这个模型在多模态理解方面是个巨大的降本增效神器。具体来看各项测试： Expert（专业能力），Kimi排名最高，第10。Seed第11，GLM、qwen、ernie比较靠后。 Hard Prompt（高难度指令处理），Seed第8，其他家都在20名开外。 Coding能力，Seed第7，Kimi第12。其他家在后面。这项最令人意外，因为它比的是全语言、全场景的综合编程能力，在WebDev榜单排名前列的GLM5反而落在后面。 Math（数学）上，又是Kimi最高第8，Seed第10，这俩排在前面。 Creative Writing（创意写作），最高的GLM5只排第22，跟体感也比较接近，理科生偏科了。指令遵循和长文本测试，国产模型都不太理想，最好成绩都是十几名，还需要努力。这么看下来，Kimi k2.5有几项能力还是比较突出的，但不知为何总排名落在了后面。 Seed 2.0 pro也已经接入了豆包「专家」模式。相比以前豆包一直在用的中小杯模型，智商终于有救了。这个事情意义很大，毕竟豆包是我们身边的家人朋友们用的最多的AI产品了。

2周前

英伟达提供的2027财年第一财季指引强于预期。营收料再创新高，指引区间中值较分析师预期高7.1%，同比增速较四季度加快至近77%。英伟达指出，该指引不含中国市场的数据中心计算收入。

2周前

阴伟达？符合商标法吗

3周前

折腾好几天总是给自己设限，其实只要你真的努力一下就解决了做 Agent 一定要努力啊

3周前

ARR 到达 2 亿美金也只需要18万付费用户。

3周前

人类任何合作的本质就是双方都放弃一些安全感，并且默认对方不会利用这点安全感伤害对方，由此达成了信任的默契。 Agents 之间的信任是什么？人和 Agents 之间的信任是什么？

3周前

护城河是为了防止敌人和动物入侵是一种冷兵器时代时代的古董设计它不是为了也根本防不住滔天大浪《在 Agent 冲击下仍然具有护城河的十种 SaaS》

3周前

这世界很怪 Agent 到达了 AGI，而人类越来越反智了

3周前

飞机上看了多半本《未来简史》虽然作者完全无法想象当下这个未来还是从过去的梳理中汲取了不少营养

3周前

Sonnet 4.6 并没有超过 Opus 4.5

3周前

早晨醒来看到大聪明的文章《我们，已迈过奇点》 “迈过奇点”这应该是当下AI发展的最准确的一个描述。也许 AGI 还没到，但在人类发明 Claude Code、Opus 4.5和 OpenClaw 之后，奇点实际已经到了。 "奇点"这个词最早来自数学和物理学。在数学里，奇点是函数"爆掉"的那个点——比如 1/x 在 x=0 的时候，值冲向无穷大，原来的规则在那个点上失效了。黑洞的中心也是一个奇点，已知的物理定律在那里全部失灵。奇点到了之后，已知的规则会全部失灵。人类过去所有的经验、制度、直觉，都没法用来预测接下来会发生什么了。就像你站在黑洞的事件视界外面，看不到里面的任何信息。 “互联网已死”只是一个表象，其实是一切的规则都失效了，一切的预测都失效了。从来没有一个科幻作家想过“智能不再稀缺”这件事。就像人类无法想象黑洞里的样子。

3周前

如果裸 Token 的 ROI 大于 1 那 Token 和 Money 区别是什么？

1个月前

以前不知道这个时代电视台存在的意义是什么今年知道了原来就是给 AI 和机器人打广告啊

1个月前

原来 CLI 读作 ci line

1个月前

还得是贾樟柯配上新时代的摄影机🎥 飞得更高

1个月前

龙虾作者为什么选择 OpenAI？ Clawdbot —> OpenClaw 这个改名已经预示了一切。 Peter 在 Claude 要求改名后，去问 Sam 能不能用 OpenClaw，Sam 说没事，你尽管用。这就是格局的差异。 Peter 吐槽说 A 社只有法务部会发邮件联系他甚至都没争取过这是 Peter 的官方博客通知： OpenClaw、OpenAI 与未来 | Peter Steinberger Peter Steinberger —— 2026年2月15日摘要（tl;dr）：我将加入 OpenAI，致力于将“智能体（agents）”普及给每一个人。OpenClaw 将移交给基金会管理，并保持开源与独立。过去的一个月简直像旋风一样。我从未预料到我的这个练手项目（playground project）会掀起如此大的波澜。互联网再次变得有些不可思议，看到我的作品能激励全球这么多的人，这种感觉真的非常奇妙。无数的可能性在我面前展开，无数人试图把我推向不同的方向：给我建议、询问如何投资、或是打探我的下一步计划。用“应接不暇”来形容这种状态都有些保守了。当我开始探索 AI 时，我的目标只是寻找乐趣并启发他人。而现在，这只“龙虾（lobster）”正在席卷全球。我的下一个使命是构建一个连我妈妈都能轻松使用的智能体。这需要更深层次的变革，需要更多关于安全性的思考，以及接触最前沿的模型和研究成果。没错，我完全可以预见到 OpenClaw 能够成长为一家巨大的公司。但是，这对我来说并没有太大的吸引力。我骨子里是一个“构建者（builder）”。我已经玩过“开公司”这套游戏了——我为此倾注了 13 年的心血并受益匪浅。我现在想要的是改变世界，而不是建立一家大公司。而与 OpenAI 联手，是将这一切普及给每个人的最快途径。上周我在旧金山与各大实验室进行了交流，接触到了顶尖的人才和尚未发布的科研成果，这一切都极具启发性。我想感谢本周与我交谈过的所有人，也为这些机会感到自豪。对我而言，OpenClaw 保持开源并拥有蓬勃发展的自由一直至关重要。最终，我觉得 OpenAI 是继续推进我的愿景并扩大其影响力的最佳场所。与那里的人交流得越多，我就越清楚地意识到我们有着共同的愿景。围绕 OpenClaw 形成的社区充满魔力，OpenAI 已经做出了郑重承诺，支持我继续投入时间，并且已经开始资助该项目。为了使其具备更规范的架构，我正努力将其转变为一个基金会。它将继续作为思想者、黑客和希望掌控自身数据的人们的阵地，目标是支持更多的模型和公司。就我个人而言，我非常兴奋能加入 OpenAI，成为 AI 研发最前沿的一员，并继续与大家一起构建未来。 The claw is the law.

1个月前

龙虾作者 Peter 官宣加入 OpenAI Clawdbot —> OpenClaw 这个改名已经预示了一切。 Peter 在 Claude 要求改名后，去问 Sam 能不能用 OpenClaw，Sam 说没事，你尽管用。这就是格局的差异。这是 Peter 的官方博客通知： OpenClaw、OpenAI 与未来 | Peter Steinberger Peter Steinberger —— 2026年2月15日摘要（tl;dr）：我将加入 OpenAI，致力于将“智能体（agents）”普及给每一个人。OpenClaw 将移交给基金会管理，并保持开源与独立。过去的一个月简直像旋风一样。我从未预料到我的这个练手项目（playground project）会掀起如此大的波澜。互联网再次变得有些不可思议，看到我的作品能激励全球这么多的人，这种感觉真的非常奇妙。无数的可能性在我面前展开，无数人试图把我推向不同的方向：给我建议、询问如何投资、或是打探我的下一步计划。用“应接不暇”来形容这种状态都有些保守了。当我开始探索 AI 时，我的目标只是寻找乐趣并启发他人。而现在，这只“龙虾（lobster）”正在席卷全球。我的下一个使命是构建一个连我妈妈都能轻松使用的智能体。这需要更深层次的变革，需要更多关于安全性的思考，以及接触最前沿的模型和研究成果。没错，我完全可以预见到 OpenClaw 能够成长为一家巨大的公司。但是，这对我来说并没有太大的吸引力。我骨子里是一个“构建者（builder）”。我已经玩过“开公司”这套游戏了——我为此倾注了 13 年的心血并受益匪浅。我现在想要的是改变世界，而不是建立一家大公司。而与 OpenAI 联手，是将这一切普及给每个人的最快途径。上周我在旧金山与各大实验室进行了交流，接触到了顶尖的人才和尚未发布的科研成果，这一切都极具启发性。我想感谢本周与我交谈过的所有人，也为这些机会感到自豪。对我而言，OpenClaw 保持开源并拥有蓬勃发展的自由一直至关重要。最终，我觉得 OpenAI 是继续推进我的愿景并扩大其影响力的最佳场所。与那里的人交流得越多，我就越清楚地意识到我们有着共同的愿景。围绕 OpenClaw 形成的社区充满魔力，OpenAI 已经做出了郑重承诺，支持我继续投入时间，并且已经开始资助该项目。为了使其具备更规范的架构，我正努力将其转变为一个基金会。它将继续作为思想者、黑客和希望掌控自身数据的人们的阵地，目标是支持更多的模型和公司。就我个人而言，我非常兴奋能加入 OpenAI，成为 AI 研发最前沿的一员，并继续与大家一起构建未来。 The claw is the law.

1个月前

今天用 Claude Code 重做 YouTube 字幕翻译扩展上次用龙虾随便做了个能用的版本。这次想严肃地做一下：样式更好看，功能更完善，以此为基础做更多 YouTube 相关的功能。结果第一个功能就踩坑了。想加个字幕下载功能，看起来很简单：YouTube 有 ytInitialPlayerResponse，里面有字幕 URL，下载就行了。直接下载 → 空文件（缺少认证）改用 fetch → 0kb 加格式参数 → 还是 0kb XML 转 SRT → 依然不行折腾了半天，YouTube 的字幕 API 限制太多，根本做不到。最后直接删掉，专注实时翻译这一件事。看来 Vibe Coding 还是不能随心所欲，哪怕是这么简单的功能。

1个月前

工程师们终于发现，自己成了最大的瓶颈用户上报bug后，AI 完全可以自己写代码和测试现在所有的流程，创建工单、Slack 协作，Linear 协作，推送代码到 GitHub、运行 CI、审核 PR、合并 PR，全都过时了。甚至连那个该死的bug都是用户的 Agent 上报的我们需要改变

1个月前

字节发布 Seed2.0，相比其他模型的自夸宣传，字节这次反向操作，非常严谨指出了自己在 Coding 和世界知识方面不如竞品 Claude 和 Gemini。从 Model Card 来看， Seed2.0 非常强调真实世界任务，猜测其算法团队内部已经彻底摒弃了「刷分」这类自欺欺人的操作。像之前推出的 Seedance 2.0 这种模型，好就是好，根本不需要跑分作为支撑。清晰的自我认知，是技术进步的先决条件。以下内容翻译自官方发布的 Model Card：需要注意的是，Seed2.0 系列与国际前沿大语言模型（LLMs）仍存在差距... Seed2.0 系列在编码方面与 Claude 相比存在相当大的差距（considerable gaps），以 SWE-Evo 和 NL2Repo 为例。 Seed2.0 系列在与用户体验密切相关的长尾知识方面与 Gemini 相比存在相对明显的差距（relatively obvious gaps），以 SuperGPQA 和 SimpleQA-Verified 为例。

1个月前

读完了 Opus 基于我的文章写的科幻小说，太震撼了再改改，明天发出来

1个月前

当人类不再"使用"软件，DAU这个概念就彻底死了。取而代之的是一个新指标：TPD，Token Per Day，每日Token消耗量。

...