[2508.03012] Tool-integrated Reinforcement Learning for Repo Deep Search 这个和前面那个mcp rl有一拼，增强LLM的tools using能力

#LLM #强化学习 #工具 #深度搜索 #AI

相关新闻

Xiaowen

8小时前

所有的创新周期，有大有小，几乎都有固定不变的节奏。 - 初期：纯新阶段，有大量的信息差存在，信息差即可牟利。 - 成熟初期：信息差几乎不存在，认知差存在。认知差可牟利（知识付费，顾问） - 中期：认知差几乎不存在，开始进入社会垂直生态，有固定商业价值。 - 晚起：完全融入社会结构，成为纯粹共识和生产资料的一部分，几乎全民所有。现在的 AI 仍然远远还在初期。但你用什么姿势去创业，结果可能

Xiaowen

9小时前

有件尴尬的事是，我对 AI 的很多思考，周围的人听不懂了🫠

Dash

10小时前

上周五公司问答环节，同事们提的问题几乎都是 AI 相关。很多同事都在焦虑—— AI 未来必然大批量淘汰传统工作的前提下，公司接下来会有什么策略应对。我觉得今天没有人能够真正说清楚未来到底会变成什么样。但有一件事情是现在可以做的，就是积极拥抱变化。让所有同事可以没有任何障碍地接触到全世界最好的 AI 模型。随意的去学习、尝试和使用。

Andy Stewart

12小时前

这么好的天气，陪老婆去整点菜😎 大丰收啊，晚上有口福了。搞点腊肉炒一炒反正现在有了懒猫微服 LightOS，在哪都能嘴控 AI 给我啃次啃次写代码🤣

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

12小时前

这才是super intelligence该有的样子😛