时政
财经
科技
虚拟货币
其他
登录
#思维链
关注
meng shao
1天前
Claude 最新博客:提示词工程最佳实践 🧠 核心技术 1. 明确清晰 现代 AI 模型对清晰明确的指令响应特别好。不要假设模型会推断你的意图——直接说出来。 举例:创建分析仪表板 · 模糊:"创建一个分析仪表板" · 明确:"创建一个分析仪表板。包含尽可能多的相关功能和交互。超越基础,创建一个功能完整的实现。" 2. 提供上下文和动机 解释为什么某事重要,帮助 AI 更好理解你的目标。 举例:格式偏好 · 效果差:"永远不要使用项目符号" · 效果好:"我更喜欢自然的段落形式,因为我觉得流畅的散文更易读、更有对话感。项目符号对我的休闲学习风格来说太正式了。" 3. 具体化 越具体越好。包括明确的约束条件、相关上下文、期望的输出结构以及任何要求或限制。 4. 使用示例 通过展示而非描述来说明,特别适合解释概念或演示特定格式。这被称为单样本或少样本提示。 重要提醒:Claude 4.x 等现代模型非常关注示例中的细节,确保你的示例符合你想要鼓励的行为。 5. 允许表达不确定性 明确允许 AI 表达不确定性而非猜测,这能减少幻觉并提高可靠性。 举例:"分析这些财务数据并识别趋势。如果数据不足以得出结论,请直说,不要猜测。" 🔝 高级技术 1. 预填充 AI 的响应 通过为 AI 开始响应,引导格式、语气或结构。这对于强制输出格式或跳过开场白特别有效。 2. 思维链提示(Chain of Thought) 要求逐步推理后再回答,有助于复杂的分析任务。 现代方法:Claude 提供了"扩展思考"功能,可自动进行结构化推理。但了解手动思维链在某些情况下仍然有价值。 三种常见实现: · 基础思维链:简单添加"逐步思考" · 引导式思维链:提供特定的推理阶段 · 结构化思维链:使用标签分离推理和最终答案 3. 控制输出格式 · 告诉 AI 要做什么,而非不要做什么 · 让你的提示词风格匹配期望的输出 · 明确说明格式偏好 4. 提示词链(Prompt Chaining) 将复杂任务分解为多个连续步骤,每个提示词处理一个阶段,输出传递给下一条指令。 这种方法牺牲延迟换取更高的准确性。适用于复杂请求、需要迭代改进、多阶段分析等场景。 可能遇到的旧技术 XML 标签结构:曾经推荐用于添加结构和清晰度,但现代模型在没有 XML 标签的情况下也能很好理解结构。在极其复杂的提示词或需要绝对确定内容边界时仍可能有用。 角色提示定义专家角色和视角。虽然有效,但现代模型已足够成熟,沉重的角色提示通常不必要。 组合使用 真正的力量在于策略性地组合这些技术。提示词工程的艺术不是使用所有可用技术,而是为特定需求选择正确的组合。 技术选择指南 · 需要特定输出格式 → 使用示例、预填充或明确格式指令 · 需要逐步推理 → 使用扩展思考(Claude 4.x)或思维链 · 复杂多阶段任务 → 使用提示词链接 · 需要透明推理 → 使用结构化输出的思维链 · 防止幻觉 → 允许说"我不知道" 常见问题排查 · 响应太泛泛 → 增加具体性、示例或明确要求全面输出 · 响应偏题 → 更明确说明实际目标,提供上下文 · 格式不一致 → 添加示例或使用预填充 · 任务太复杂 → 分解为多个提示词 · AI 编造信息 → 明确允许说"不确定" 需要避免的错误 · 过度工程化:更长更复杂的提示词并不总是更好 · 忽略基础:如果核心提示词不清楚,高级技术也无济于事 · 假设 AI 会读心:对想要的内容要具体 · 同时使用所有技术:选择针对特定挑战的技术 · 忘记迭代:第一个提示词很少完美,需要测试和改进 核心建议 提示词工程最终是关于沟通:用帮助 AI 最清楚理解你意图的语言说话。从核心技术开始,持续使用直到成为第二本能。只有在解决特定问题时才添加高级技术。 记住:最好的提示词不是最长或最复杂的,而是用最少必要的结构可靠地实现目标的那个。 提示词工程是上下文工程的基本构建块。每个精心设计的提示词都成为塑造 AI 行为的更大上下文的一部分,与对话历史、附加文件和系统指令一起创造更好的结果。 博客地址:
Claude Skills系统发布引发AI行业新变革· 50 条信息
#提示词工程
#Claude
#AI
#最佳实践
#思维链
分享
评论 0
0
Y11
1个月前
如果你也想深入了解<LLM-based planning agents>领域,推荐参考三篇研究: 《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》揭示了思维链提示如何激发模型推理; 《HuggingGPT》展示了多模态工具协同的实践; 《Understanding the planning of LLM agents》则系统梳理了当前研究进展。 这些探索,或许正是AI从“被动响应”走向“主动规划”的必经之路。
#LLM
#思维链
#HuggingGPT
#主动规划
#AI
分享
评论 0
0
Tom Huang
5个月前
这个也太酷了!支持本地部署,字节跳动刚刚宣布发布了一款 7B 的多模态模型⚡️ 支持思维链思考和生成图片,并且支持支持自然语言编辑能力,在开启 CoT 的基础上,性能超越 Gemini-2-exp 的生图能力 开源地址 👉
#字节跳动
#7B多模态模型
#思维链
#图像生成
#CoT
#Gemini-2-exp
#开源
分享
评论 0
0
环球网-环球时报
8个月前
马斯克称将发布“地球上最聪明AI”,最大特点是引入“思维链”推理能力
比原计划推迟了数月之后,美国亿万富豪埃隆·马斯克宣布,旗下的人工智能初创公司xAI将于美国当地时间2月17日晚上发布最新版Grok 3聊天机器人,他将Grok 3描述为“地球上最聪明的人工智能(AI)”,这也引起外界对Grok 3的高度关注。
马斯克Grok再升级,4代直播发布引爆AI· 36 条信息
#马斯克
#AI
#思维链
#推理能力
#科技创新
分享
评论 0
0
orange.ai
9个月前
深度角色扮演模型 DeepSex 使用思维链和强化学习技术增强模型角色扮演,小说生成能,提升模型的创作能力。 四阶段进化架构: 增量预训练:注入0.4T Token 小说,使用16k上下文训练,增强文本连贯性 Tifa-SFT:融合全球Top4角色扮演模型Tifa的10万条高质量数据 CoT恢复训练:采用Deepseek-32B/671B数据重建推理能力 RL强化:保留发散性思维标签的同时优化生成质量 工程创新: 16k超长上下文训练 随机截断训练增强鲁棒性 8×H20 GPU全量微调 启示与后续: 我们在测试中发现,满血R1在角色扮演中输出内容比较发散,随机,导致此模型有相同倾向,对于角色扮演的影响还在研究中 输入内容相近的话语会导致向量重叠,然后重复输出,如“继续”,“还有”等无明显指向性话语 思维内容与正文关联性学习了满血R1的特点,发散比较严重,可能会有割裂感 针对以上问题,我们正在编写新的RL算法,初步计划剔除部分满血R1的内容,同时通过强化学习解决重复
#深度角色扮演
#DeepSex
#思维链
#强化学习
#模型创作
#小说生成
#预训练
#角色扮演模型
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞