【Anthropic开源Circuit Tracer：大语言模型可解释性研究新工具】 Anthropic今日正式开源Circuit Tracer工具，为LLM内部工作机制研究提供新方案。主要功能包括： - 神经元级特征电路可视化 - 概念激活路径追踪 - 支持因果分析方法该工具旨在帮助研究人员深入理解大语言模型的决策过程和工作原理。 GitHub：技术白皮书： #AI研究 #可解释AI

#AI研究 #可解释AI

相关新闻

OTC潇潇

3天前

最近一心研究AI，发的推少了。我一直都在。出金干货看以前的文章，都有

沉浸式翻译

4天前

你有没有发现：我们每天都在和 LLM 对话，但其实完全不理解它在“想”什么？大多数人以为 AI 是一条路走到黑的“概率复读机”，但真正卡住模型推理能力的，是它缺乏像人类一样“悔棋”和“推演”的过程。这个交互式站点，本质上是 LLM 思考过程的“CT 扫描仪”。在 AI 研究圈子里，它被当成是 2026 年最直观的 MCTS（蒙特卡洛树搜索）原理解释器。你学不会 AI 原理也许是因为

lencx

4个月前

把 Ilya 的播客整理成文章了，他的许多回答都符合直觉，但又细思极恐（两张截图结合起来看，总觉得他发现了些什么）。 Ilya Sutskever：AI 研究、泛化与未来之路

宝玉

4个月前

来自 X 账号 TestingCatalog 的爆料：Google 在 Gemini 企业版（Gemini Enterprise）里新增多智能体「自动做研究」模式 Google 正在 Gemini for Enterprise 里打造一个多智能体系统。你给它一个主题，再配上一套评估标准，它就能自己生成一大堆点子，然后拉起一整支智能体团队，像打锦标赛一样一轮轮评审这些点子。这个系统一次可以连

Mr Panda

4个月前

很佩服在ai 这么浮躁的环境下，还有一些人在潜心做一些深入的研究工作。