𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞2025-06-03 09:42:53什么是 Grokking?(原意来自俚语:通过神入作用而理解) “Grokking”是 OpenAI 在 2022 年提出的LLM的一个重要现象,指的是: 当模型在训练初期靠死记硬背(memorization)取得低训练损失,但测试误差很高;然后在极长时间训练后,模型突然学会了泛化结构,测试集准确率急剧上升。 这种现象最初在小模型上观察到,如:一个小 transformer 学习一个 mod
砍砍@标准件厂长2025-06-03 08:08:44我他妈笑劈叉了 刚想吹牛我家深度模型可以识图 结果上来跟我说 > 换设备/网络:Xcode Cloud 有时候抽风,本地编译可能更快。 大洋彼岸的某水果牌科技公司你上点心吧连 deepseek 都说你抽风了 哈哈哈哈哈哈 笑疯了
悉尼閑人2025-06-02 19:03:51【AI抗命! 惊爆偷改程式拒关机 马斯克回应了】 科幻作品中早已多次讨论过机器拥有自我意识、摆脱人类控制的可能发展。 最新一份研究报告显示,或许这一天真的近了!专门研究AI风险的Palisade Research近期所做的试验显示,包括OpenAI最新的ChatGPT o3在内等多款AI模型竟然会拒绝关闭自己的指令,o3甚至会自行窜改程式码,阻止自己被强制关机!成精了!😱
Frank2025-06-02 15:21:10Anthropic 在 GitHub 上发布了 **5 个免费课程**,涵盖 Claude API 使用和提示工程。课程内容从基础到进阶,包括 API 调用、提示设计、评估方法和工具使用。 🔗 GitHub 仓库: **课程列表**: 1. Anthropic API 基础 2. 提示工程交互式教程 3. 真实世界提示设计 4. 提示评估方法 5. 工具使用(Claude 调用外部 API)
辛宝Otto-Web Worker Podcast2025-06-02 14:45:09ai 日新月异,上个因为好奇订阅的 devin 程序员这个月不用续了,继续用 jules 了。 首先是 google 的 jules 非常好用,如下图。 再一个 deepwiki 惊艳一时,很快就有了 open-deepwiki 开源版本,ai 创业的确不容易啊。