马东锡 NLP 🇸🇪2025-04-22 04:30:13「Agent, RAG, Reasoning」论文 ReSearch: Learning to Reason with Search for LLMs via Reinforcement Learning ReSearch,充满了 ReAct 的影子。它教会模型“何时求助于世界”;但局限在于,ReSearch 只能依赖一种工具。 作者提出了一种创新的框架,名为 ReSearch,旨在
AI Dance2025-04-18 22:15:20改变AI认知的一篇文章 我敢说这是今年最值得每个人读的AI blog,让我彻底震撼! OpenAI researcher 姚顺雨的blog,这里有个趣事,贵清有两个yaoshunyu,一个在Anthropic、一个在OpenAI。 文章非常好,像是某个大佬深夜写的真心话,可惜最近一直比较忙,没时间细写。网上也有不少写的了,我们就写一个普通人能看懂的版本吧。 不再刷榜!大模型的下一个10年:真
李老师不是你老师2025-04-17 22:54:06美国众议院中国问题特别委员会,周三发表报告,称DeepSeek构成“严重”安全威胁。报告指DeepSeek会将数据传回中国,给用户形成安全隐患;所使用的模型也根据中国法律秘密审查和操纵信息;DeepSeek规避美国出口管制采购了数万块晶片,委员会要求英伟达提供客户信息。 纽约时报引述知情人报道,特朗普政府正考虑采取惩罚措施,阻止DeepSeek购买美国技术,并正讨论是否禁止美国人使用DeepSe