#思维链

1个月前

Claude 最新博客：提示词工程最佳实践 🧠 核心技术 1. 明确清晰现代 AI 模型对清晰明确的指令响应特别好。不要假设模型会推断你的意图——直接说出来。举例：创建分析仪表板 · 模糊："创建一个分析仪表板" · 明确："创建一个分析仪表板。包含尽可能多的相关功能和交互。超越基础，创建一个功能完整的实现。" 2. 提供上下文和动机解释为什么某事重要，帮助 AI 更好理解你的目标。举例：格式偏好 · 效果差："永远不要使用项目符号" · 效果好："我更喜欢自然的段落形式，因为我觉得流畅的散文更易读、更有对话感。项目符号对我的休闲学习风格来说太正式了。" 3. 具体化越具体越好。包括明确的约束条件、相关上下文、期望的输出结构以及任何要求或限制。 4. 使用示例通过展示而非描述来说明，特别适合解释概念或演示特定格式。这被称为单样本或少样本提示。重要提醒：Claude 4.x 等现代模型非常关注示例中的细节，确保你的示例符合你想要鼓励的行为。 5. 允许表达不确定性明确允许 AI 表达不确定性而非猜测，这能减少幻觉并提高可靠性。举例："分析这些财务数据并识别趋势。如果数据不足以得出结论，请直说，不要猜测。" 🔝 高级技术 1. 预填充 AI 的响应通过为 AI 开始响应，引导格式、语气或结构。这对于强制输出格式或跳过开场白特别有效。 2. 思维链提示（Chain of Thought）要求逐步推理后再回答，有助于复杂的分析任务。现代方法：Claude 提供了"扩展思考"功能，可自动进行结构化推理。但了解手动思维链在某些情况下仍然有价值。三种常见实现： · 基础思维链：简单添加"逐步思考" · 引导式思维链：提供特定的推理阶段 · 结构化思维链：使用标签分离推理和最终答案 3. 控制输出格式 · 告诉 AI 要做什么，而非不要做什么 · 让你的提示词风格匹配期望的输出 · 明确说明格式偏好 4. 提示词链（Prompt Chaining）将复杂任务分解为多个连续步骤，每个提示词处理一个阶段，输出传递给下一条指令。这种方法牺牲延迟换取更高的准确性。适用于复杂请求、需要迭代改进、多阶段分析等场景。可能遇到的旧技术 XML 标签结构：曾经推荐用于添加结构和清晰度，但现代模型在没有 XML 标签的情况下也能很好理解结构。在极其复杂的提示词或需要绝对确定内容边界时仍可能有用。角色提示定义专家角色和视角。虽然有效，但现代模型已足够成熟，沉重的角色提示通常不必要。组合使用真正的力量在于策略性地组合这些技术。提示词工程的艺术不是使用所有可用技术，而是为特定需求选择正确的组合。技术选择指南 · 需要特定输出格式 → 使用示例、预填充或明确格式指令 · 需要逐步推理 → 使用扩展思考（Claude 4.x）或思维链 · 复杂多阶段任务 → 使用提示词链接 · 需要透明推理 → 使用结构化输出的思维链 · 防止幻觉 → 允许说"我不知道" 常见问题排查 · 响应太泛泛 → 增加具体性、示例或明确要求全面输出 · 响应偏题 → 更明确说明实际目标，提供上下文 · 格式不一致 → 添加示例或使用预填充 · 任务太复杂 → 分解为多个提示词 · AI 编造信息 → 明确允许说"不确定" 需要避免的错误 · 过度工程化：更长更复杂的提示词并不总是更好 · 忽略基础：如果核心提示词不清楚，高级技术也无济于事 · 假设 AI 会读心：对想要的内容要具体 · 同时使用所有技术：选择针对特定挑战的技术 · 忘记迭代：第一个提示词很少完美，需要测试和改进核心建议提示词工程最终是关于沟通：用帮助 AI 最清楚理解你意图的语言说话。从核心技术开始，持续使用直到成为第二本能。只有在解决特定问题时才添加高级技术。记住：最好的提示词不是最长或最复杂的，而是用最少必要的结构可靠地实现目标的那个。提示词工程是上下文工程的基本构建块。每个精心设计的提示词都成为塑造 AI 行为的更大上下文的一部分，与对话历史、附加文件和系统指令一起创造更好的结果。博客地址：

Claude Skills系统发布引发AI行业新变革· 66 条信息

#提示词工程 #Claude #AI #最佳实践 #思维链

2个月前

如果你也想深入了解<LLM-based planning agents>领域，推荐参考三篇研究：《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》揭示了思维链提示如何激发模型推理；《HuggingGPT》展示了多模态工具协同的实践；《Understanding the planning of LLM agents》则系统梳理了当前研究进展。这些探索，或许正是AI从“被动响应”走向“主动规划”的必经之路。

#LLM #思维链 #HuggingGPT #主动规划 #AI

7个月前

这个也太酷了！支持本地部署，字节跳动刚刚宣布发布了一款 7B 的多模态模型⚡️ 支持思维链思考和生成图片，并且支持支持自然语言编辑能力，在开启 CoT 的基础上，性能超越 Gemini-2-exp 的生图能力开源地址 👉

#字节跳动 #7B多模态模型 #思维链 #图像生成 #CoT #Gemini-2-exp #开源

环球网-环球时报

10个月前

马斯克称将发布“地球上最聪明AI”，最大特点是引入“思维链”推理能力

比原计划推迟了数月之后，美国亿万富豪埃隆·马斯克宣布，旗下的人工智能初创公司xAI将于美国当地时间2月17日晚上发布最新版Grok 3聊天机器人，他将Grok 3描述为“地球上最聪明的人工智能（AI）”，这也引起外界对Grok 3的高度关注。

马斯克Grok再升级，4代直播发布引爆AI· 41 条信息

#马斯克 #AI #思维链 #推理能力 #科技创新

10个月前

深度角色扮演模型 DeepSex 使用思维链和强化学习技术增强模型角色扮演，小说生成能，提升模型的创作能力。四阶段进化架构：增量预训练：注入0.4T Token 小说，使用16k上下文训练，增强文本连贯性 Tifa-SFT：融合全球Top4角色扮演模型Tifa的10万条高质量数据 CoT恢复训练：采用Deepseek-32B/671B数据重建推理能力 RL强化：保留发散性思维标签的同时优化生成质量工程创新： 16k超长上下文训练随机截断训练增强鲁棒性 8×H20 GPU全量微调启示与后续：我们在测试中发现，满血R1在角色扮演中输出内容比较发散，随机，导致此模型有相同倾向，对于角色扮演的影响还在研究中输入内容相近的话语会导致向量重叠，然后重复输出，如“继续”，“还有”等无明显指向性话语思维内容与正文关联性学习了满血R1的特点，发散比较严重，可能会有割裂感针对以上问题，我们正在编写新的RL算法，初步计划剔除部分满血R1的内容，同时通过强化学习解决重复

#深度角色扮演 #DeepSex #思维链 #强化学习 #模型创作 #小说生成 #预训练 #角色扮演模型