什么是 Grokking？（原意来自俚语：通过神入作用而理解） “Grokking”是 OpenAI 在 2022 年提出的LLM的一个重要现象，指的是：当模型在训练初期靠死记硬背（memorization）取得低训练损失，但测试误差很高；然后在极长时间训练后，模型突然学会了泛化结构，测试集准确率急剧上升。这种现象最初在小模型上观察到，如：一个小 transformer 学习一个 mod

#Grokking #OpenAI #LLM #机器学习 #模型训练 #泛化能力

相关新闻

AIGCLINK

1天前

微软给的一套AI呼叫中心解决方案，Azure+OpenAI，扔一个API请求或直接拨号，AI语音客服即可接/打电话、记录报修、面试预约等可以呼入、呼出实时语音对话，支持打断、静音检测、多语言TTS/ASR、定制AI语音通话结束后即生成一个网页报告写工单可自定义字段，比如时间、地点、其他信息等可以定制任务流、知识库管理、定制AI语气风格 #AI语音客服

海拉鲁编程客

1天前

这个AI 世界很疯狂 Openai 忙着征服编程 Grok 忙着取代福利姬 Gemini 忙着放风不让奥特曼阻击 Anthropic 忙着把用户送给国产大模型

howie.serious

2天前

【📝 本周份的ai学习笔记】ai知识管理、ai浏览器专题如果你让评选2025年最有价值的ai工具，会是哪个？我的选择是 atlas。理由：当顶级llm和互联网无缝整合，我们获取信息的方式就从根本上发生了转变。这是一种结构性变化，不会因为人的忽视而转移。阅读笔记，温故知新～

howie.serious

3天前

llm 能不能“说人话”，更多是底层模型层面的特点，而不是靠“prompt engineering”可以解决的。 gpt-5 系列模型“不说人话”，之前很多人试过很多prompt，即使感觉有效，很多时候都是感觉而已。现在，gpt-5.1 从底层模型上尝试解决“说人话”问题。这才是正确的方向。同一个prompt，gpt-5.1 thinking 的回答，解释更清楚，使用更少的行话术语

洛克船长

3天前

OpenAI 为美国退伍军人提供一年免费 ChatGPT Plus 我特意的看了一眼咸鱼，还没有人提供帮你搞定美国退伍军人身份的服务。