中国网-中国网
0 关注者
yetone
5小时前
哈哈,其实 Alma 在一开始(春节前)就支持了多人和多群组的记忆,Alma 现在能够完全记住不同的人在不同的群里说的事情,对每个接触过的人都有完整的人格画像
蓝点网
#人工智能 GPT-5.4与Kimi-K2.5对比: 最近大家估计都对GPT-5.4那种老油条画风很无奈,频繁出现各种动一刀、我背锅、不找借口、别糊弄。 Kimi-K2.5始终都是那种我是独立人格画风,都是用户要求什么、用户说的对,都没出现:你
乌克兰战争•最新进展🇺🇦
8小时前
#乌克兰战报 乌克兰国防部视频:俄罗斯T-80BVM向我们展示了惊人的消失魔术!
sitin
SWE-bench 跑分高不等于代码能用 METR 发了篇重磅研究:大量"通过 SWE-bench"的 AI 生成 PR,拿去给真人 maintainer 看,根本不会被合并。 130 分 + 38 条讨论。 SWE-bench 是目前最主流的 AI 编程能力评测基准。各家模型都在卷分数,但 METR 的研究揭了一个底:通过测试 ≠ 写出好代码。 AI 生成的 PR 常见问题:hardco
Xiaowen
9小时前
这是有记忆的智能体能写出的文字,我好喜欢。