[2508.03012] Tool-integrated Reinforcement Learning for Repo Deep Search 这个和前面那个mcp rl有一拼,增强LLM的tools using能力
[2508.03012] Tool-integrated Reinforcement Learning for Repo Deep Search 这个和前面那个mcp rl有一拼,增强LLM的tools using能力
卫斯理
3小时前
使用wsl2写rails挺舒服的哈 外加AI 其实我什么都不懂 哈哈哈
TechFlow 深潮|APP 已上线
6小时前
AI 调教指南😊
𝘁𝗮𝗿𝗲𝘀𝗸𝘆
7小时前
《2025 年的 AI 协助编程观察》 阅读拾遗。
TechFlow 深潮|APP 已上线
7小时前
AI 调节指南😊
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
9小时前
LLM驱动的agent,要是GPT-5遥遥领先,那基于GPT-5的通用agent又要卷死一波agent应用产品?