ICL的表达力边界定理（ICL的容量限制）：如果上下文长度为 L，隐藏维度为 d，则ICL最多能表示秩为 min(L, d) 的函数。推论： •对于 L=100, d=1000 的Transformer •ICL最多能学习”100维的线性子空间” •远小于IWL的 d²=1,000,000 维参数空间这解释了： •为什么ICL适合”快速适应”（低秩近似足够） •为什么IWL适合”长期学习”

#ICL #transformer #容量限制 #线性子空间 #快速适应

相关新闻

向阳乔木

2个月前

应该是上周 Jeff Dean 在斯坦福做了个分享，用AI总结写成文章，视频见评论区 AI 是怎么突然变这么强的？ Jeff Dean，Google 的 AI 负责人，他用自己的经历，讲了这个故事。他说："我们今天看到的 AI，是过去十五年技术叠加的产物。" 不是一个突破。是一系列突破。每一个突破，都让 AI 往前跨了一大步。接下来，让我讲清楚这些突破是什么。从最早的"模型学

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

3个月前

belief shift正是icl可编程的所在人与LLM投射与反投射的第三空间可以有自己的的信念？

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

3个月前

MCP交互范式将成为基于ICL的context oriented programming标准 Skills将成为基于ICL的上下文具身经验本体的自然语言编程标准 -www.anthropic.com/engineering/code-execution-with-mcp

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

3个月前

弄来弄去还是给ICL提供上下文：给符号智能以具身经验本体

Y11

3个月前

2025年的一天，Google的会议室里，一场持续四小时的内部会议刚刚结束。屏幕上展示着最新数据：他们的AI模型Gemini用户已达4.5亿，云服务年收入突破500亿美元，自研的TPU芯片正成为全球AI算力的核心之一。但会议室里的气氛并不轻松——十年前，就是在这样的技术优势下，他们发明了Transformer，却让OpenAI和Anthropic从自己的实验室里"走"了出去。一、从微厨