时政
财经
科技

#AI研究

Frank
Frank
2025-06-01 18:24:25

【Anthropic开源Circuit Tracer:大语言模型可解释性研究新工具】 Anthropic今日正式开源Circuit Tracer工具,为LLM内部工作机制研究提供新方案。主要功能包括: - 神经元级特征电路可视化 - 概念激活路径追踪 - 支持因果分析方法 该工具旨在帮助研究人员深入理解大语言模型的决策过程和工作原理。 GitHub: 技术白皮书: #AI研究 #可解释AI

#AI研究#可解释AI
Luo说不啰嗦
Luo说不啰嗦
2025-05-27 19:00:07

看到新闻说 Llama 团队近八成顶尖研究成员已出走,Meta 不会就是传说中的 AI 黄埔军校吧!🤣

#llama#Meta#AI黄埔军校
初码
初码
2025-03-28 11:22:44

在推特发NSFW的AI研究,会被封号吗?

#NSFW#AI研究#封号
勃勃OC
勃勃OC
2025-02-22 05:44:29

OpenAI 宣布计划将其计算基础设施从微软转移至由软银支持的 Stargate 项目。 此次转型涉及重大财务投入,OpenAI 目标在 2025 年将收入提升至 125 亿美元,达到当前的三倍。 Stargate 项目预计到 2030 年将承担 OpenAI 三分之二的计算需求,这一战略举措旨在多元化基础设施合作伙伴关系,并扩大其 AI 研究能力。

#OpenAI#微软#软银
Jeff Li
Jeff Li
2025-02-01 06:05:39

半导体深喉媒体SemiAnalysis发文称,DeepSeek 获得了1万个H800 和约1万个 H100。2021年美国出口管制前,公司已弄到1万片A100。他们还订购了3万个 H20。这些 GPU由幻方量化和 DeepSeek 共享,用于交易模型和AI研究。 DeepSeek 的服务器资本支出总额接近 13 亿美元,运营成本高达 7.15 亿美元。

#半导体#DeepSeek#GPU
半导体深喉媒体SemiAnalysis发文称,DeepSeek 获得了1万个H800 和约1万个  H100。2021年美国出口管制前,公司已弄到1万片A100。他们还订购了3万个 H20。这些 GPU由幻方量化和 DeepSeek 共享,用于交易模型和AI研究。

DeepSeek 的服务器资本支出总额接近 13 亿美元,运营成本高达 7.15 亿美元。
没有更多了 🤐