时政
财经
科技
虚拟货币
其他
登录
#任务规划
关注
dontbesilent
1周前
把这个 agent 和 chat 分清楚,就知道为什么要用 genspark 和 manus 了 不是所有的问题,都可以在 10 秒钟之内完成回答 那么当你选择了一个回答所有问题耗时都小于 10 秒的工具(不联网的纯 LLM),就必然有一定比例的问题拿不到结果 日常使用的通用 AI 工具,必须有任务规划功能,必须自己决定这是一个可以立即回答的短问题,还是需要查半个小时资料才能回答的长问题 会用 agent(而不仅仅是 LLM)是日常用好 AI 的基础
#agent
#LLM
#任务规划
#长短问题
#AI工具
分享
评论 0
0
宝玉
2周前
小模型不是 Agentic AI 的未来,小模型只配给 Agent 当工具 现阶段 Agent 的主要问题不是成本过高,而是智能不足,所以做不好任务,所以需要浪费很多 Token。 不能拿小模型在特定环境特定任务 RL(强化学习) 后的结果来当证据,这不代表其在真实任务中的能力,这就是为什么一堆模型靠训练测试集刷很高分,但是实际一用很垃圾的原因。 真实世界的任务是很复杂的,用户的请求总是千奇百怪,Agent 的核心能力是能充分理解用户的需求,去规划去调用合适的工具收集上下文完成任务。 这样的核心能力连大模型都做不好,更别说现在的小模型,再怎么微调也无法提升 Agentic 能力。 但不是说小模型没用,它作为 Agent 的工具是挺好的,可以低成本高效的完成一些特定任务。 举个例子来说你要做一个翻译的智能体,你可以用 Claude 4 负责任务的规划拆分,去调用工具,但具体翻译文本,可以用一个开源的小模型帮你翻译。
#Agentic AI
#小模型
#大模型
#任务规划
#智能不足
分享
评论 0
0
dontbesilent
3周前
不会 planning 的都不是 agent 我会用 genspark 的 agent 随时随地分析大大小小的问题 但是很少用各家大模型的 deep search deep search 的 planning 不行,芝麻大的问题,都要搞几千字报告 任务规划和任务理解能力不行
#agent
#GenSpark
#Deep Search
#任务规划
#任务理解
分享
评论 0
0
WquGuru🦀
1个月前
越早意识到下面这点的Engineer越有长远优势: 当AI生成代码有问题时,你不应该自己检查,自己改,而应通过: prompt层面:更详尽的任务规划,更细分的TODO… 工程层面:e2e、单测、强类型语言… 给到AI更多线索和约束,完全让他自己迭代 简而言之就是不要与AI发展的趋势对抗,培养工程、架构、规划能力,而不是编码能力
#AI浪潮:重塑就业,风险暗涌?· 106 条信息
#AI
#代码生成
#工程能力
#架构能力
#任务规划
分享
评论 0
0
LinearUncle
1个月前
目的:记录一次真实任务执行过程,看看 GPT-5 thinking 与 Claude Code 到底谁更靠谱。 task:`给我下载nosql所有你能找到的数据库的icons,例如redis, mongodb etc.` 结果: • GPT-5 thinking 先在网页端给出完整方案,我再拿 Claude Code 照着跑,最后连向量数据库 Milvus 的图标都收进来了,数量远多于预期。 • 直接让 Claude Code 干,只抓回 10 个,还混进几个错的。 小结:先用 GPT-5 thinking 做任务规划,再用 Claude Code 当苦力,效果最稳。
#GPT-5 thinking
#Claude Code
#数据库图标
#任务规划
#向量数据库Milvus
分享
评论 0
0
S Li
4个月前
助理,直观的理解是他们至少可以帮我把要做的事情排排优先级,拟定一个基本的日程或者计划,根据我的反馈更新一个备忘录并提出一些跟进建议,然后才是去执行具体的任务。现在这些agent,还是需要使用者本身具备制定目标和计划的能力,特别是任务拆分和配置的经验。 如果说他们主要是面向产品/项目经理的,就需要使用者具备一定的的软件开发经验,不然单单是配置好github就够费劲儿的。如果是面向软件开发者的,坦率地说,这个群体天生就喜欢随性随性地攻坚克难,用这些助理,既不能“享受”手撸代码的乐趣,又要把自己假想成自己的“天敌”-产品/项目/售前经理,还是很需要一定的适应能力的。
#任务规划
#项目管理
#软件开发
#产品经理
#自动化工具
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞