AIGCLINK
2个月前
Anthropic关于上下文工程的最新发布:要想充分发挥AI智能体的潜力,需要上下文工程! 博客讲了上下文工程在构建AI智能体中的重要性及相关策略,是对提示工程的进一步拓展和深化 提示工程,关注的是如何写出更好的提示词 上下文工程,关注的是在模型推理过程中,如何持续选择和管理最有助于任务完成的信息(也就是上下文),包括系统提示、工具、外部数据、对话历史等等 构建有效上下文的原则是用最少的、高价值的信息,引导模型产生最佳行为 1. 系统提示 应清晰、简洁、具体,避免过度逻辑化或过于模糊 推荐分模块组织,比如说背景、指令、工具说明、输出格式等,使用XML或 Markdown标签 初始提示应尽可能小,是指信息刚好足够引导行为,然后根据测试结果逐步补充 2. 工具 工具应功能单一、清晰、无歧义,避免功能重叠 工具返回的数据应精简、高效,避免浪费上下文空间 工具集应保持“最小可用集”,便于模型决策和维护 3. 示例 提供典型、多样化的示例,避免堆砌边缘案例 示例比规则更有助于模型理解任务 动态的获取上下文,与其一次性加载所有信息,不如让智能体在运行时通过工具动态获取所需数据 1.通过文件路径、命名规则、时间戳等元数据判断信息的相关性 2.支持“渐进式信息发现”,避免一次性加载大量无关内容 对于持续数分钟到数小时的任务,比如代码迁移、研究项目,需要特殊策略应对上下文窗口限制 1. 压缩 定期总结对话内容,保留关键信息,比如决策、bug、实现细节,丢弃冗余内容 可结合模型自动生成摘要,保持任务连续性 2. 结构化笔记 智能体定期将关键信息写入外部记忆,比如文件、数据库 在需要时再将相关内容加载回上下文 3. 多智能体架构 主智能体负责任务协调,子智能体负责具体子任务 子智能体可深入探索某一问题,仅将摘要返回主智能体,避免上下文过载 适用于复杂研究、并行任务等场景 #上下文工程 #ContextEngineering
AIGCLINK
4个月前
OpenAI GPT-5已发布,推理、编程能力更强,速度更快,400K上下文,可以免费使用! 以下对它的推理、编程能力、上下文窗口、API定价以及其他更新整理汇总,一文看全GPT-5 首先GPT-5是一个统一模型,它会自动判断何时需要更复杂的推理,无需手动或自动切换模型 性能表现: 在SWE-bench Verified和Aider Polyglot上,思考模式下均超过了o3 数学表现,在AIME 2025上, GPT-5 Pro使用Python作为工具,准确率为100% 在可靠性和准确性上比之前的模型有提升,幻觉率和错误率更低 具备超强工具使用能力,在Tau上准确率达到了97% GPT-5擅长数学、物理、法律、医学等多个领域;可以软件按需定制,根据需求描述从零编写完整程序;可以以交互的方式来解释复杂的概念,2分钟内生成约400行代码 其他更新: 写作能力:优化了写作能力,写作质量有提升,能更好的理解语境细节 语音功能增强:声音更自然更智能,免费用户可以连续聊天数小时,高级用户几乎无限制,还可以自定义 个性化:可以自定义聊天框的颜色、研究个性化预览、记忆力增强、集成Gmail、Google日历等 开发者可通过API使用这三个模型 GPT-5 GPT-5 mini GPT-5 nano GPT-5,功能最强大版,适合处理复杂的编程以及需要模型自主行动的智能体任务 mini,更快更具成本效益版,适合需求明确、范围清晰的任务 nano,速度最快、最具成本效益版 上下文窗口: 支持400K上下文,128K token的输出 文本、图像多模态输入 具备性价比: GPT-5 输入,1.25美元 输出,10美元 缓存输入,0.125美元 GPT-5 mini 输入:0.25美元;输出:2.00美元 GPT-5 nano 输入:0.05美元;输出:0.40美元 GPT-5现在已向免费、Plus、Pro和团队用户开放,下周向教育和企业用户开放,免费用户达到限制后将会切换到 GPT-5 mini,Pro用户可无限制使用 微软的产品Microsoft 365 Copilot、Microsoft Copilot、 GitHub Copilot 、Visual Studio Code、Azure AI Foundry等都已可用GPT-5 #chatgpt5 #GPT5 #OpenAIGPT5
AIGCLINK
5个月前