「Agent, RAG, Reasoning」论文 ReSearch: Learning to Reason with Search for LLMs via Reinforcement Learning ReSearch，充满了 ReAct 的影子。它教会模型“何时求助于世界”；但局限在于，ReSearch 只能依赖一种工具。作者提出了一种创新的框架，名为 ReSearch，旨在

#agent #RAG #reasoning #Research #React #强化学习 #大模型 #Reinforcement Learning #工具使用 #创新框架

相关新闻

花花

5小时前

用了同样的问题提问claude gpt gemini，说实话，claude领先能力太强了，gemini和gpt差不多吧。大家还有啥更聪明的大模型吗？我来学习一下。

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

1天前

3月最后两天进入垃圾时间，大模型们都在憋着人间4月天！

Geek

1天前

GPT 刚出来时，我还想着能自己部署 GPT-3.5，用上一辈子就满足了。没想到发展这么快，很多大模型有些甚至还没来得及体验，就已经迭代更新了。现在，自己能部署一个 Qwen3.5-27B 给虾哥用用，我就很满足了。我非常看好 Apple silicon 在大模型上的发力。我的第一个真正可用的自部署大模型，一定会是在 Apple 上实现。

0xLeon @ Hubble.xyz

3天前

突然冒出来个想法：打造一个面向Agent的投资研究机构，覆盖股票和Crypto，主要的服务对象是其他的Agent。可以起个洋气点的名字。龙虾证券。反正再过两年做交易的都是龙虾了🦞。

数字生命卡兹克

3天前

杨植麟、张鹏、罗福莉等齐聚一堂，他们关于OpenClaw的观点值得一听。今天是2026中关村论坛的人工智能主题日。我也定了个一早的闹钟准时起来看。这个活动海淀已经办了第三年，但今年的议程密度确实有点夸张。一上午塞进了开源联盟成立、主权大模型白皮书发布、北京市人工智能协会揭牌，外加两场圆桌。大模型和具身智能各一场。嘉宾阵容从Eclipse基金会到智谱、小米MiMo、无问芯穹，再到