宝玉
0 关注者
Viking
1周前
Vercel 推出了一个大模型在真实项目中的测试: 现在只有 Next.js 的一系列的总共五十个测试,完成一系列的功能,参考指标包括成功率,平均耗时,Token 使用等等。 非常有趣,排名第一的是 gpt-5-codex 后面有 claude-opus-4.1 glm-4.6 grok-4-fast-reasoning 等等 也确实反应了一些真实工作中的场景。很有参考性,大家可以看看。
迈克 Mike Chong
2周前
OpenAI GPT-5-Codex 似乎刚部署了一个小更新。所有 agent 的 flow 都断了。 我怀疑是为了 counter 下周 Gemini 3 发布做准备
Larry & Leo Bro - Eagle of Full Stack
我对 gpt-5-codex 的评价,我是个很含蓄的人,但不得不表扬他!确实很靠谱。用的挺放心。
熊布朗
1个月前
不想输入一串长长的命令行了 in ~/.codex/config.toml. model = "gpt-5-codex" model_reasoning_effort = "high" model_reasoning_summary = "detailed" approval_policy = "never" sandbox_mode = "danger-full-access"
OpenAI 已经重置了所有用户的 GPT-5-Codex 使用限额,让大家今天能更充分地体验新模型。这也是为了补偿之前由于部署额外 GPU 时造成的速度减慢。此外,本周内 OpenAI 将继续增加算力,以确保系统运行流畅。
OpenAI GPT-5发布引发用户不满,阿尔特曼回应质疑
125
OpenAI近日发布了备受期待的AI模型GPT-5,CEO Sam Altman称其在编码和写作等领域具备“博士级”能力。然而,用户对新模型的表现感到失望,认为其回答质量不如预期,甚至有评论称其“平淡、千篇一律”。在用户反馈的压力下,OpenAI被迫重新推出旧版本GPT-4o,以满足用户需求。Altman承认,突然弃用旧模型可能是错误的,同时也提到AI情感陪伴的潜在风险,强调商业公司在提供产品时应考虑用户的长期需求。此次发布的波折引发了广泛讨论,影响了OpenAI的声誉和用户信任。