蓝点网
1个月前
💥💥💥 #Anthropic 再次指责中国人工智能公司通过大规模蒸馏攻击非法获取 #Claude 系列模型的能力来训练自己的模型。 然后埃隆马斯克称 Anthropic 自己不也是从人类程序员那里剽窃技能 (原话:他们怎么敢偷走 Anthropic 从人类程序员那里偷来的东西?) 模型蒸馏本身是一种合法的训练模式,蒸馏指的是利用性能更强的模型输出来训练弱模型,各种开源模型都会互相借鉴来提高能力,而闭源模型例如 Claude 通常会在使用条款里注明禁止蒸馏,所以 Anthropic 称这三家公司属于蒸馏攻击 (非法)。 Anthropic 新发布的研究报告称,DeepSeek、月之暗面和 MiniMax 三家公司创建了 2.4 万个虚假账户,与 Claude 产生超过 1,600 万次对话交互,其中 DeepSeek 交互次数最少,只有 15 万次,月之暗面交互次数 340 万次,而 MiniMax 交互次数高达 1300 万次。 不同公司的交互目的也不同,MiniMax 大规模交互主要是为了提取编程和工具使用能力,月之暗面的目标是瞄准智能体推理和计算机视觉方面的,而 DeepSeek 则关注推理过程。 比较有意思的是 DeepSeek 虽然交互次数最少,但让 Claude 反向复述自己的推理过程,DeepSeek 可能是利用推理过程来生成思维链训练数据。 另外 Anthropic 还强调通过 IP 地址和元数据等信息将攻击归因到具体公司甚至具体的研究人员身上。(这似乎也在暗示,如果美国政府有需要的话,甚至可以通过这些个人信息制裁特定研究人员。)