GPT 4.5 终于发布了，Scaling Law 撞墙说的就是它？预训练的计算量是 GPT4 的10倍，但是基准测试只比 4o 好 5% Devin 的代码测试超过了 Claude 3.5，但是不如 Claude 3.7 国外网友在吹写作，但是也有人发现不如 DeepSeek R1 输入75美元，输出150美元/百万token，是其他模型的10-100倍。又贵，又慢，又不够好非常尴尬

#GPT4.5发布 #ScalingLaw #基准测试 #Devin代码 #claude3.5 #Claude3.7 #国外网友评论 #写作能力 #DeepSeekR1 #模型性价比 #高成本 #模型性能

相关新闻

Cali Castle

3周前

OpenAI 厉害了，经过一天的测试下来，GPT 5.4 (high thinking) 在 🦞 上表现是大于 Sonnet 4.6，约等于 Opus 4.6 的压力测试了我过去所有的用例，结论是比 Opus 要快大概 30% 左右，完成任务质量跟 Opus 大差不差，我的财务、HR、客户经理 agent 已经切过去变主力模型了再用一段时间看看

徒步的骑手

3周前

数学能力实际上跨文理科。在北大哲学系念书的时候，最聪明的学生是数理逻辑专业的，他们要去数学系选课。来美国以后，越来越后悔，年轻时没下功夫学数学。回头看看，思维能力、写作能力、搭建结构的能力，甚至有条理地交流的能力，好象都得益于最基本的数学训练。如果从头开始，回到20岁，会做三件事：1. 用功学好数学；2. 细读哲学和文学经典；3，学习草根生活智慧。

哥飞

4个月前

上周，花两千刀，相当于一万多块钱，买了个 com 域名，立项做个新产品。估计元旦前能上线。

小互

4个月前

流传着一份泄漏的Gemini 3 的基准测试结果不知道真假😌 今晚见分晓

送姜

4个月前

你越是会写作，你越能把AI写作用的好。很多人觉得AI写作现在已经这么强了，自己没有必要去练习写作了。我不认可这种观点。写作的核心是什么？是整理加表达，是一种结构化甚至系统化的能力。写作能够提升你的逻辑能力和表达能力。而这两种能力才是写作能力的元能力。 AI只能保证写作的下限，而且完全由AI写的文章，充满了逻辑正确却毫无新意的内容。我们往往就是因为听过太多正确的道理，所以我