北火

北火

0 关注者

3个月前

Claude Sonnet 4 强大到什么地步了呢?我只需要说测试没有通过,它自己去检查并且分析出来了我对 models 做了很大的改动,并且根据新的 models 的继承情况,修正了测试数据。全程没有给任何 contexts ……

#Claude #AI技术 #自动化测试 #模型改动

相关新闻

placeholder

AI Will

1小时前

Anthropic 70%、80% 甚至 90% 的代码都是由 Claude 编写的。 人们认为这是假的,因为他们觉得这意味着要解雇 70%、80% 或 90% 的软件工程师,但真正发生的是,人类变成了 AI 系统的管理者。

placeholder

indigo

4小时前

Anthropic 经济指数报告第三次迭代!研究追踪了过去 8 个月里,个人用户在 Claude 上的行为变化。AI 的任务正在从常规商业到知识密集型工作转变,虽然编程(计算机与数学任务)仍然以 36% 的份额占据主导地位,但知识密集型领域的使用正在快速增长。 - 教育指导任务:使用份额从9.3% 飙升至 12.4%。 - 生命、物理和社会科学任务:从 6.3% 增长至 7.2% 。 - 商业与

placeholder

henu王凯

20小时前

原来这两天Claude也发了一篇根据自己数据的AI使用研究(是之前AI经济研究的第三篇),也非常值得细看:和ChatGPT的研究还是有很大区别,Claude的用户量偏小,使用场景相对聚焦(生产力方向)

placeholder

Baye

1天前

使用了一周 Codex,我的测试一直和中推捧 Codex 踩 Claude Code 相反。Codex(gpt-5(-codex)?-high)的验收率远低于 Claude(Opus+Sonnet)。但是 Codex 做 Code Review 效果非常好,经常能一针见血指出 bug。

placeholder

红网-经济日报

2天前

AI技术之光照进“无人家务”梦想

© 2025 news.news. All rights reserved. 0.11028 秒. v1.0.46
我的评论