小互
1个月前
扎格伯格巨资从OpenAI挖走三位顶尖研究员 甚至在内部成立了专门的挖人小组 奥特曼此前爆料Meta开出高达1亿美元的签约奖金来挖人 根据多家媒体报道,Meta成功从OpenAI挖走三位顶尖研究员——卢卡斯·贝耶尔(Lucas Beyer)、亚历山大·科列斯尼科夫(Alexander Kolesnikov)和翟晓华(Xiaohua Zhai),以加强其“超级智能”(superintelligence)项目。 这三位研究员此前在OpenAI位于瑞士苏黎世的办公室工作,并于2024年晚些时候共同设立了该办公室。他们在加入OpenAI之前,曾在谷歌DeepMind共事,拥有深厚的合作基础和技术专长。 据《华尔街日报》报道,扎克伯格亲自参与了全球顶尖AI人才的招聘工作,通过电子邮件和WhatsApp直接联系目标研究员,甚至在内部设立了名为“招聘派对🎉”的聊天群来协调招聘目标。他还曾在加州帕洛阿尔托和太浩湖的家中举办晚宴,邀请潜在的AI人才。 三位研究员的背景 卢卡斯·贝耶尔(Lucas Beyer):在谷歌工作六年半,专注于支持多模态AI的机器学习系统,研究领域包括可扩展的AI模型,能够整合文本、图像等多种数据模态。他在谷歌DeepMind期间参与了多项尖端视觉模型的开发。 亚历山大·科列斯尼科夫(Alexander Kolesnikov):同样在谷歌工作六年半,担任高级研究员,专注于视觉AI技术。他在2018年至2024年间领导了多项视觉模型的训练,包括2019、2020和2021年ImageNet上的最先进(SOTA)模型。他还是Vision Transformer(ViT)论文的共同第一作者,该论文提出了视觉Transformer模型,引用量高达4.9万次。 翟晓华(Xiaohua Zhai):一位华人研究员,本科毕业于南京大学,2014年获得北京大学计算机科学博士学位。在谷歌DeepMind担任高级研究科学家和经理,领导苏黎世的多模态研究团队,专注于多模态数据(如WebLI)、开放权重模型(如SigLIP、PaliGemma)以及文化多样性研究。他也是ViT论文的共同第一作者。 这三位研究员在谷歌DeepMind合作期间,共同开发了包括Vision Transformer(ViT)、SigLIP、PaliGemma等在内的多个前沿视觉模型,为计算机视觉和多模态AI领域做出了重要贡献。他们在2024年12月从谷歌DeepMind跳槽至OpenAI,并在苏黎世设立了OpenAI的欧洲办公室,专注于多模态AI研究。 OpenAI的反应与行业影响 OpenAI发言人证实了三位研究员的离职,但未提供进一步细节。OpenAI首席执行官萨姆·奥特曼(Sam Altman)在6月17日的一档播客节目中透露,Meta曾向OpenAI员工提供高达1亿美元的签约奖金,以吸引其顶尖人才。奥特曼表示,尽管Meta的报价极具诱惑力,但OpenAI的核心团队成员尚未接受这些 offer。
小互
1个月前
一份判决书揭秘了Anthropic训练模型细节 五位作家起诉 Anthropic,指控其在训练 Claude 模型过程中使用了数百万本未授权图书(电子书和纸质书)。 2021-2022 Anthropic了下载 Books3(含近 20 万本图书)、LibGen(超 500 万本)、PiLiMi(200 万本)等盗版资源 用于构建“内部研究图书馆” (未直接用于训练全量数据,但内容被用于评估、采样和过滤)。 2024年起: Anthropic转向合法方式:大规模购买实体书籍并扫描 聘请前 Google 图书项目高管 Tom Turvey,设法规避法律阻力。 从零售商、批发商处以数百万美元购买纸质图书(包括二手书)。 服务商负责拆书、扫描、OCR 建立数字副本,构建高质量文本语料库。 法院判决: ✅ 被裁定为“合理使用”的部分: 扫描纸质图书(合法购买)供内部使用,用于模型训练。 法院认为这种做法具有“转化性”(transformative use),构成合理使用(fair use)。 图书未被向外部公开,模型输出也不是原书复制。 ❌ 仍将进入审判的争议部分: 下载使用盗版电子书的行为(如Books3、LibGen、PiLiMi) 法官确认 Anthropic 明知使用盗版数据并长期保留。 虽然后期承诺不再使用,但已造成版权侵害。 有趣的是法院对“合理使用”的核心论点: 法官认为:就像人类“读书→理解→写作”,不能要求每次回忆书中思想都支付版权费用。 “人们阅读、记忆、再创作已有文学结构,从中发展新的思想与写作风格。不能因引用或受启发就处处收费。” 法官强调模型学习与人类阅读记忆之间的相似性,指出模型不是“复制”,而是“吸收与转化”。😂