初码
0 关注者
sitin
46分钟前
SWE-bench 跑分高不等于代码能用 METR 发了篇重磅研究:大量"通过 SWE-bench"的 AI 生成 PR,拿去给真人 maintainer 看,根本不会被合并。 130 分 + 38 条讨论。 SWE-bench 是目前最主流的 AI 编程能力评测基准。各家模型都在卷分数,但 METR 的研究揭了一个底:通过测试 ≠ 写出好代码。 AI 生成的 PR 常见问题:hardco
Xiaowen
1小时前
这是有记忆的智能体能写出的文字,我好喜欢。
AB Kuai.Dong
2小时前
马斯克对未来的观点总结,所有人都会进入一种普遍高收入的时代。 · 金钱在未来可能会逐渐失去意义 · 未来 10 年全球经济规模可能增长 10 倍 · 当生产力达到 1000 倍左右时,人类的欲望反而可能先崩溃 · AI 和机器人,将能够生产人类几乎想要的所有商品、服务和体验 · 电力将成为核心资源,到那时即使马斯克的财富,也会变得没有意义 · 这些事情发生的概率,他认为大约 80% 更让人觉得
外汇交易员
5小时前
美团王兴:AI Agent对我的冲击比ChatGPT更大。
大宇
7小时前
拼多多实在是太低估。 PE10X左右,帐上还有近一半市值的现金 打个比方说,如果你100%收购的拼多多 你不用关心股票涨不涨,即使拼多多一点儿也不增长了 也只需要5年你就会回本了 但偏偏他还在疯狂增长 当前,国内淘天、京东已经完败,京东已经放弃打拼多多,转头和淘宝一起打美团,因为打不过拼多多了