「LLM， Agent, RL的关系」在LLM的语境下，Agent是能理解问题，自主进行推理（Reasoning），并采取行动的系统。你可以把它想象成一个非常聪明的助手，当你提出复杂问题时，它不会立即给出答案，而是会在内心进行推理和规划（Planning），再给出最终决定。如果我们回顾prompt engineering中提高LLM Reasoning能力的方法，如Self-Consis

#LLM #agent #RL #reasoning #planning #Prompt Engineering #AI助手 #自主推理

花花

4小时前

用了同样的问题提问claude gpt gemini，说实话，claude领先能力太强了，gemini和gpt差不多吧。大家还有啥更聪明的大模型吗？我来学习一下。

蒜蓉鱿鱼须

5小时前

看到一句话，袁世凯是第一个死于个性化推荐算法的人… 这句话包含了所有我对LLM的担忧。

向阳乔木

2天前

Claude看你在达到每日限制后，手动编写代码的样子...

砍砍.ᐟ

3天前

好他妈烦啊都 2026 年了 LLM 的各种接口都还是各说各话的操

0xLeon @ Hubble.xyz

3天前

突然冒出来个想法：打造一个面向Agent的投资研究机构，覆盖股票和Crypto，主要的服务对象是其他的Agent。可以起个洋气点的名字。龙虾证券。反正再过两年做交易的都是龙虾了🦞。