howie.serious
0 关注者
indigo
3小时前
即便是最强大的模型,表现也差强人意!当把测试基准集换成 SWE-BENCH PRO 之后,得分直接从 Verified 的 70% 下滑到了不到 25%。因为 Verified 测试集数据污染严重,AI 可能在训练中“背会”了答案;然后任务过于简单,与现实中软件工程师面临的复杂挑战严重脱节。PRO 测试集针对性的做了提升,而且还新增了企业级、长周期的任务👀 - 公开集(Public Set):表
Tiger Chen & 前端之虎陈随易
19小时前
用回gpt5了,不用gpt5-codex了。花了几个小时,代码都写完了,直接用git回到最开始的状态了。。
张蔓蔓
1天前
上联:舟行万里终靠岸 下联你怎么对?
德潤傳媒
2天前
🇺🇸🔥在萬人齊聚的體育場裡,特朗普總統發表了沉重而充滿激情的講話——悼念9月10日遇害的查理·柯克這是他講話全文,43分鐘長,從開場致敬到結束宣布勳章,全無剪輯,现做了中文字幕供您欣賞: 他稱查理是“美國自由的殉道者”,因敢於講真話、為信仰和正義發聲而被激進分子殘忍奪走生命。 川普回顧了查理從芝加哥少年,到18歲創立Turning Point USA,一步步將青年運動推向全國的歷程。 他強調,
LotusDecoder
科幻: AI 纪年法 用自己主用model 的发布日作为时间纪年方式, 例如今天 2025-09-23 是 GPT-5 发布第 48 天。 那么可以做笔记写上, GPT-5 元年48日。 --- 起因是,见了一位老朋友,过年期间碰面的,最近又见一面,感觉朋友没什么变化,当然才半年是没什么变化。 但我感觉自己,自 o1-pro 、gemini-2.5-pro 的密集咨询之后,这半年的价值