砍砍@标准件厂长
0 关注者
蓝点网
4小时前
#Claude 为什么出现长达 1 个月的质量下降?#Anthropic 发布博客详细说明每个问题的发生原因并强调绝对不是故意的。该公司称绝对不是故意降低响应质量的,绝对不会因为需求、时间或服务器负载等各种原因降低模型响应质量,此次问题纯粹是 BUG。查看全文:
Jesse Lau 遁一子
5小时前
同样用在deep think的prompt(左图) 放在AI Studio gemini 2.5 pro thinking budget开到最大,结果无端端出来个2023年(右图)😅
Michael Anti
1天前
暑假我培训凯恩C++和算法,是我第一次尝试用AI来做一个真实项目。我之前没学过C++(我学校学的是BASIC、汇编,后来用的是VB和Python),所以每一步都是靠AI根据竞赛大纲来做教案、出题、帮凯恩Debug。一个暑假下来,凯恩从零到通过学校奥赛资格赛,我也比较熟悉C++了。未来更多事情都会这样交付给AI。
Kai
最近 claude code 是有啥 bug 么?总是 compact 失败
Lex Tang
bugOS 26 Xcode 26 里新建一个 Finder Sync Extension 的话,调试时会撑破整个 Finder 工具栏
AI高考数学测试:O3意外落后,Gemini夺冠引发热议
29
在近期的AI高考数学测试中,O3虽然未降智,但却屈居第四,未能进入前三名,引发了广泛的质疑与讨论。此次测试不仅使用了O3,还引入了其他模型的API进行统一评估,并加入了人气模型Gemini 2.5 Pro。结果显示,国内多款模型在推理能力上有显著提升,基本都能考上130分以上,其中Gemini在客观题测试中表现最佳。随着AI数学能力的提升,未来的测试结果可能会趋于满分,导致各模型之间的区分度降低。这一现象引发了对AI发展趋势的深入探讨,尤其是在教育领域的应用前景。