时政
财经
科技
虚拟货币
其他
登录
meng shao
关注
统计数据
176
文章
0
粉丝
0
获赞
1871
阅读
热门文章
1
TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...
145
32
meng shao
4小时前
看似 Claude Code 和 OpenCode 结对编程 实则 MiniMax-M2.1 和 GLM-4.7 暗中较劲
分享
评论 0
0
meng shao
5小时前
这个 Agent Skills 集合站,来源是 Github 开源且 Star > 2 的项目,居然有 66541 个,还是有些意外。 从变化趋势看,1月份暴涨几十倍,这也符合在 X 看到分享 Skills 的感受,大家都在做 Skills 的实战和分享。 分享的内容多、优质内容多,当然是好事,这种集合站也是很好的灵感来源,不过最终对我们自己有用的 Skills,肯定不会多,就那么几个自己确实有用、好用的就可以。 理解清楚 Agent Skills 的逻辑、理清自己的需求、找到合适的 Skills、磨出最符合自己需求的,大概是这个流程吧。
分享
评论 0
0
meng shao
1天前
DeepSeek 最新的两篇论文「mHC」和「Engram」都看到了创始人「梁文锋」的署名,虽然 DeepSeek V4 还没来(不会真的要踩春节时间吧..),但能看出 DeepSeek 在模型“计算效率”和“能力扩展”上持续的研究,不受限于 Transformer 的认知范围。 mHC:为“激进”的架构加上“安全阀” DeepSeek 提出的 mHC (Manifold-Constrained HC),巧妙地通过数学上的“流形约束”(将矩阵投影到双随机流形上),在保留 HC 强表达能力的同时,强制恢复了信号传播的稳定性 。更重要的是,通过极致的工程优化(如 Kernel Fusion 和 DualPipe 调度),消除了 HC 的额外开销,让这种先进架构真正具备了“大规模训练可用性” 。 Engram:让大模型学会“查字典”而非“死记硬背” 现有的 Transformer 没有原生的“查表”能力,遇到人名、地名或固定短语时,必须动用昂贵的注意力机制去计算,这既浪费算力又占用推理深度 。 DeepSeek 提出的 Engram 模块,复兴了经典的 N-gram 思想,构建了一个巨大的、低成本的静态知识库。模型可以通过门控机制自主决定何时“查字典”获取事实知识,何时动脑筋进行推理 。不仅解耦了记忆与计算,还意外地大幅提升了模型在代码、数学和长文本任务上的推理能力 。 当然 DeepSeek 的研究成果也不是横空出世自己造轮子,他们也在吸收很多业界研究沉淀,有些研究当时看起来比较超前不易落地,但随着大模型的发展,DeepSeek 再往前探索一步,就有了落地的可能性。在 DeepSeek 的论文引用中,看到了两个很重要的研究成果 Hyper-Connections (HC) 和 OverEncoding、SCONE、UltraMem 等,这些研究来自国内团队「字节跳动」。 Hyper-Connections (HC) :字节的 HC 打破了 ResNet 十年来的统治范式,指出了“拓扑结构”是提升模型潜力的关键维度。DeepSeek 的 mHC 正是基于这一蓝图进行的“工程化与实用性升级”,将一个理论上可行的 Idea 变成了工程上落地的 SOTA 。 OverEncoding、SCONE 和 UltraMem 等:这些研究充当了“直觉验证者”。字节通过一系列论文证明了“Scaling Embedding”是一条走得通的路,验证了 N-gram 结构在大模型中的有效性 。DeepSeek 则以此为基线,通过引入更精细的门控交互和深层融合,解决了字节早期方案(如 OverEncoding 简单的平均融合)的局限性,从而实现了更优的 Scaling 效果 。
分享
评论 0
0
meng shao
2天前
Agent Skills 铺天盖地,看了太多教程、实战和资源库,会有种错觉:万物皆 Skills ... 但这明显不对,如果在不恰当的用途用,或者硬要用 Skills,结果自然不会好! 我把 Anthropic Agent Skills 的文档和博客等塞进 AI 让它理解哪些场景要用 Skills、哪些场景滥用 Skills。 什么场景下要用 Skills? · 涉及“非通用”的硬性流程 · 任务需要“确定性”工具/代码辅助 · 上下文涉及文档多,长度太大不能一次性加载 什么场景下滥用 Skills? · 角色扮演包装 · 一次性任务 · 纯知识堆砌(没有流程) 一句话来讲:能用 Prompt 或 Context 搞定的「文本」,不要强行包装成 Skills!
分享
评论 0
0
meng shao
2天前
今天突然看到非常多「阿里千问点外卖」和「百度文心 ERNIE 排名 Top10」的内容 还没具体看,潜意识里的感觉「没人用」和「没人信」😂 毕竟大家都知道,一般内容刷屏时,要么是真的「炸裂」,要么是 PR Deadline,上面二位明显属于后者
分享
评论 0
0
meng shao
3天前
微软在 AI 上的表现非常令人失望,几乎没有之一! 随手截图两张:Microsoft Copilot 和 Github Copilot 前者还像是 ChatGPT 初期的某个套壳 AI 聊天助手,几乎没有任何近一年内的新功能; 后者的首页视频,居然还是 Claude 3.5 Sonnet ... 这样的问题并不是少数,它贯穿在微软几乎所有产品中,也包括 Azure AI Foundry 等等等等 手握企业市场这么强的客户资源,Windows、Office、Azure 这么多优质用户和数据,结果是什么也没做好,反观 Google 这几年在 AI 领域的强势发力,微软到底怎么了? 以上很多个人情绪,未必客观,因为从微软把我最喜欢的 Windows Phone 作没之后,对微软的好感就高不起来了
分享
评论 0
0
meng shao
4天前
关于 Agent Skills,在看教程或复用别人开源的 Skills 之前,还是建议先通过官方文档了解 Agent Skills 的编写和运行原理,以及各 AI Agent SKills 的编写存放规则,把常用的文档都放在下面 👇🏻 Claude Code: Cursor: OpenCode: Codex: Gemini CLI: Ampcode: Cline:
分享
评论 0
0
meng shao
4天前
我的 Anthropic 2026 年首封 🤦🏻♀️ 之前一直在用的 Anthropic 账号前不久被封禁了,今天新注册了一个 Google 账号,刚一登录直接就封禁了 我只是想体验一下新的 Cowork 啊 😂
分享
评论 0
0
meng shao
4天前
Apple Intelligence 终于敲定了 Google Gemini Apple 到底选择谁作为 AI 模型合作方,去年讨论的沸沸扬扬,OpenAI 一度非常接近,Anthropic 也被传过收购,不过现在回看,Google Gemini 确实还是最佳选择,他们不但有覆盖文本、图像和视频的系列模型,还有成熟的云平台、TPU 等全生态链路。 这回 Siri 终于可以期待一下了,希望 Apple 不要一直那么谨(保)慎(守),另外 Google 的股票看起来还得涨啊 😄
分享
评论 0
0
meng shao
6天前
[开源推荐] Vibe Kanban: Kanban + AI Coding Agents 分享的私心:我自己特别喜欢看板工具,十多年前用 Trello 就很喜欢,后来工作中的项目管理软件也都有看板模块。现在 AI Coding Agents 多个并行时,看板一上,就有 AI Agents Lead 的小组长感了! 项目定位:AI 智能体的“调度台” 在传统的 AI 开发模式中,使用 Claude Code、Cursor、Codex 或 Gemini 时,开发者通常需要守在终端前等待 AI 生成代码并手动检查。vibe-kanban 改变了这一点: · 异步执行:你可以像指派任务给人类员工一样,在看板上创建多个任务卡片,并分别为其分配不同的 AI Agents。 · 并行工作:AI Agents 在后台并行运行,开发者无需等待,可以同时处理多个功能模块的开发。 技术亮点:解决 AI 协作的“冲突”与“信任” vibe-kanban 在技术实现上解决了 AI 编程中的两个痛点:隔离与评审。 · Git Worktrees:这是该项目最惊艳的设计之一。每个 AI 任务都在独立的 Git Worktree 中运行。这意味着不同的 AI Agents 之间不会互相干扰,也不会污染你当前的主分支。 · 内置 Diff 评审:AI 完成任务后,你可以通过内置的 Diff 工具像审查 PR 一样查看 AI 修改的代码,确认无误后再一键合并到主分支。 · MCP 支持:它支持集中配置 MCP 服务器,这意味着你可以让 AI Agents 访问你的本地数据库、文档或特定的开发工具。 项目系统架构 · 后端:采用 Rust 语言编写(基于 Axum 框架),保证了极高的性能和处理本地 Git 操作的稳定性。 · 前端:使用 React 和 TypeScript 构建,提供直观的 Trello 式操作体验。 · 存储:采用本地 SQLite 数据库,所有的任务记录、Agents 日志都保存在本地,兼顾了隐私和速度。 开源地址
分享
评论 0
0
meng shao
1周前
[Agent Skills 推荐] Notion Skills for Claude 来自 Notion 官方发布的 Claude Skills 指南,介绍 Notion 如何与 Claude 深度集成,让 Claude 更智能地操作 Notion 工作区,在 Agent Skills 发布为公开标准后,可以适配其他 AI Agents。 前面咱们分享过 Obsidian Skills:
分享
评论 0
0
meng shao
1周前
Cursor 智能体编程最佳实践 核心习惯:先计划,后执行 · 优先使用 Plan Mode:智能体先研究代码库、问澄清问题、生成可编辑的 Markdown 计划,批准后再编码。 · 出错时:回退修改计划重新运行,比对话修补更快更干净。 上下文管理 · 信任智能体自动搜索(grep + 语义搜索),只在必要时手动标注文件。 · 新对话时机:新任务、智能体反复出错、完成一个逻辑单元。 · 长对话易分心,效果下降时立即重启;跨对话用 Chats 引用历史。 扩展智能体 · Rules(.cursor/rules/):静态规则,精简记录常用命令、风格规范、关键示例,提交到 git 共享。只在反复出错时添加。 · Skills:按需加载,自定义命令、钩子脚本等。 关键功能与技巧 · 图像支持:直接粘贴设计稿/截图,用于设计转代码或视觉调试。 · 测试驱动开发:先写测试 → 再写实现。 · 代码审查:实时观察 diff、用 Agent Review 自检、Bugbot 自动 PR 审查。 · 并行运行:多模型/工作树并行,取最优结果,适合难题。 · 云智能体:后台长任务(如补测、文档),支持 Slack 触发、远程管理。 · Debug Mode:难 bug 时,生成假设、加日志、收集运行数据、精准修复。 高效开发者共同习惯 · 提示具体明确 · 逐步完善规则/命令 · 认真审查 AI 代码 · 提供可验证目标(测试、类型、linter) · 把智能体当强大合作者:要求计划、解释、挑战方案 博客地址
分享
评论 0
0
meng shao
1周前
Gemini 3 Pro 和 Gemini App/Web 的反差实在太大了! Gemini 3 Pro 代表了谷歌 AI 崛起的最高水平,多模态能力很强,但 Gemini App/Web 实在太难用了啊 😂,约等于最难用 AI 应用,对不起这么好的模型。 交互响应慢,聊天丢信息,历史记录和新建聊天常年没反应,我都想直接去用 Google AI Studio 了,Deepmind 是不是把产品和开发都投到 Google AI Studio 去了,Gemini App/Web 啥时候能重视起来?
分享
评论 0
0
meng shao
1周前
[开源推荐] 🚀 SuperClaude Framework: 为 Claude Code 安装了一套“增强插件系统”和“工作流框架”,让 Claude Code “变身” 为结构化、全流程的软件开发平台! 强大的“工具箱”:30 个斜杠命令 (/sc) 它不再让你用口语去吩咐 AI,而是提供了标准化的命令。这极大地提高了执行的确定性和效率。 · /sc:research:进行深度联网搜索。 · /sc:implement:标准化的代码实现流程。 · /sc:pm:项目管理,自动记录任务进度。 · /sc:brainstorm:结构化的头脑风暴,避免 AI 胡言乱语。 16 个“专业分身”:专家级 Agent SuperClaude 预设了 16 种不同领域的 AI Agents,它们不是简单的改个名字,而是拥有不同的思考逻辑: · PM Agent:负责任务跟踪和持续学习。 · Security Engineer:专门寻找代码中的安全漏洞。 · Frontend Architect:深谙 UI 模式和前端架构。 MCP 协议集成:打破“信息孤岛” 该项目深度支持 MCP 协议。通过安装 8 个内置的 MCP 服务器(如 Tavily, Playwright, Context7),Claude Code 可以: · 实时爬取网页(甚至是需要浏览器操作的页面)。 · 查阅最新的官方文档(通过 Context7)。 · 进行多步推理(Sequential Thinking),减少 AI 的逻辑跳跃。 深度研究能力 这是 v4.1 版本后的重头戏。它让 AI 具备了像人类研究员一样的能力: · 多跳推理:搜到一个信息后,自动追踪相关联的作者、项目或历史。 · 质量评分:自动给搜索到的来源打分,低于 0.6 的信息会被过滤。 开源地址
分享
评论 0
0
meng shao
1周前
10 个真正改变我工作方式的 Claude Skills Reddit/ClaudeAI 中看到的帖子,作者总结了自己持续测试后真正觉得有价值的 10 个 Skills,聚焦于提升生产力、自动化和专业输出,涵盖开发、文档、设计、测试等场景。 1. Rube MCP Connector 通过一个统一的 MCP 服务器,将Claude一次性连接到 500+ 应用(Slack、GitHub、Notion 等),无需为每个应用单独配置认证。适合需要大量自动化集成的用户,大幅节省时间。 2. Superpowers(obra 开发的开发者工具包) 提供 /brainstorm、/write-plan、/execute-plan 等专用命令,将 Claude 从普通聊天机器人转变为完整的开发工作流辅助工具。对严肃编码的人来说是重大提升。 3. Document Suite(Anthropic 官方 Skills) 让 Claude 真正擅长处理和创建 Word、Excel、PowerPoint、PDF 文件,支持正确格式、公式等,而不仅仅是读取。处理客户发来的复杂文件时特别实用。 4. Theme Factory 一次性上传品牌指南(颜色、字体等),之后 Claude 生成的所有 Artifacts 都会自动遵循该风格。非常适合营销团队保持品牌一致性。 5. Algorithmic Art 基于 p5.js 的生成艺术工具,只需文字描述(如“蓝紫渐变流场,5000 个粒子,种子 42”),即可生成可复现的艺术作品。适合创意编码者。 6. Slack GIF Creator 直接根据描述生成专为 Slack 优化的自定义动画 GIF,无需再去 Giphy 搜索。实用且有趣的小工具。 7. Webapp Testing 使用 Playwright 自动化框架,描述测试需求(如“测试登录流程”),Claude 就能编写并运行测试脚本。QA 工程师和开发者会觉得特别好用。 8. MCP Builder 快速生成自定义 MCP 服务器的样板代码,将搭建集成的时间缩短约80%。适合自己开发 Skills 或复杂集成的用户。 9. Brand Guidelines 与 Theme Factory 类似,但支持同时管理多个品牌风格,并轻松切换。适合需要处理不同品牌项目的团队。 10. Systematic Debugging 让 Claude 按资深工程师的思路系统化调试:找出根本原因 → 提出假设 → 提供修复方案 → 编写文档。避免了以往“瞎猜式”调试。 上面这 10 个 Skills 的资源地址:
分享
评论 0
0
meng shao
1周前
这两天用 Grok 罢工的频率有点高,今天早上连续罢工几次,弹出升级 “SuperGrok” 订阅的提醒... 我当时心想,Grok App 的日活这么高了吗?转念一想,不对,Grok 的算力虽然和 Grok API 可能是独立的,但 X 上铺天盖地的让 Grok 👙 P 图的需求可是不少啊 😂 xAI 的战略也是有点看不懂。 一面 Grok Code Fast 1 要做免费策略 OpenRouter 使用量霸榜,但提起编程模型始终还是 Claude、Gemini、GPT 和其他开源模型们。 另一面 X 上 Grok 各种花活不断,是为了拉高 X 活跃度和广告价值?还是为 Grok 积累模型训练数据?
分享
评论 0
0
meng shao
1周前
[开源推荐] Planning with Files: 复现 Manus “价值 $2 billion” 的工作流 (抄的作者 readme,略标题党),把它做成 Claude Code 的 Agent Skills! 这个开源项目作者是 Othman Adi,他的灵感来源于最近被 Meta 以 20 亿美元收购的 Manus。Manus 的核心竞争力并非仅在于模型本身,而在于其极其高效的任务编排和上下文工程能力。Adi 通过逆向工程发现,Manus 成功的关键之一是使用了一种极其简单但极其有效的“外部存储”机制,而 planning-with-files 正是这一机制的开源实现,让它成为 Claude Code 的 Agent Skills。 核心原理:把 Markdown 当作 AI 的“外挂大脑” 传统的 AI 助手在对话变长后,由于上下文窗口限制或注意力分散,往往会忘记最初的目标。 这个项目通过自动创建和维护三个关键的 Markdown 文件,为 AI 建立了一套持久化工作记忆: · task_plan.md(任务清单):记录大目标的拆解步骤,每步都有复选框。AI 在做任何决定前,必须先读一遍这个文件,确保不偏离方向。 · notes. md(研究笔记):存放搜索到的资料、调研结果和中间结论。这样关键信息就不会淹没在聊天记录里,而是存在硬盘上,随时可查。 · deliverable. md(最终产出):专注于存放最终要交付的代码或文档,与思考过程分离,保持干净。 它解决了啥问题? · 记忆波动:在传统模式下,AI 的 Todo 列表往往只存在于对话中,一旦对话太长或环境重置,AI 就会失去进度。这个项目让进度“写死”在磁盘上。 · 目标漂移:AI 经常在处理子任务时忘记主任务。强制性地阅读 task_plan. md 就像给 AI 戴上了“防分心眼镜”。 · 上下文臃肿:通过将研究细节存在外部笔记中,避免了把所有冗余信息都塞进极其昂贵的对话上下文里,既省钱又提高了 AI 的推理准确度。 开源地址
分享
评论 0
0
meng shao
1周前
跟着 Anthropic 博客和文档,学习「Agent Skills」构建的最佳实践 重新阅读了 Anthropic 工程博客和 Agent Skills 文档: 1. 2. 在这两篇文章中,找到了 Agent Skills 构建的这几个关键原则和最佳实践,咱们是基于 Claude 来解读的,但同样适用于其他 AI Agents,咱们一起看看。 先说结论:一个优秀 Skill 的“标准画像” · 名字(Name):使用动名词(如 processing-pdfs),清晰明确。 · 描述(Description):用第三人称(如 "Processes Excel files..." 而不是 "I can help you..."),并包含具体的触发关键词。 · 核心文件:一个精炼的 SKILL. md 作为“中控台”,若干个 .md 作为“专业手册”,以及一组 .py 或 .sh 脚本作为“精密工具”。 1. “极简主义”:只提供 Claude 不知道的信息 Claude 本身已经拥有庞大的知识库,上下文窗口是昂贵的公共资源。 · 不要过度解释:如果 Claude 已经知道什么是 PDF 或 Git,不要在技能中解释这些基础概念。 · 挑战每一行文字:问自己:“Claude 真的需要这段解释吗?”、“这段话的 Token 成本是否换回了足够的价值?” · 对比示例: · 反面(啰嗦):“PDF 是一种便携式文档格式,要提取它,你需要安装 pdfplumber 库...” · 正面(专业):直接给出代码示例 import pdfplumber; ...。 2. 动态调节“自由度”:给 Claude 合适的约束 根据任务的性质,决定给 Claude 多少发挥空间。 · 高自由度(文字指令):适用于有多种路径可通向成功、需要根据上下文做决策的任务(如:代码审查、内容润色)。 · 中自由度(带参数的脚本):适用于有固定模式但需要灵活配置的任务(如:生成周报、数据分析)。 · 低自由度(固定脚本):适用于极度脆弱、不容出错的任务(如:数据库迁移、系统部署)。 · 金句:像对待机器人一样——在悬崖边的窄桥上,给它死指令(低自由度);在开阔的草原上,给它大方向(高自由度)。 3. 利用“渐进式披露”结构化你的文件夹 不要把所有东西都塞进一个 SKILL. md,这会迅速耗尽 Token。 · 保持扁平化:官方建议参考链接只保留一层深度。即 SKILL. md 直接指向 reference. md,不要出现 SKILL. md -> A. md -> B. md 的深层嵌套。 · 模块化拆分: · 如果技能涉及多个领域(如财务、销售),将它们拆分为 finance. md 和 sales. md。 · 在 SKILL. md 中做一个“目录”,Claude 只有在处理财务问题时才会去读取财务相关的详细文档。 · 长文档技巧:如果一个参考文件超过 100 行,务必在顶部加一个目录。这能确保 Claude 即使只是部分预览文件,也能看到全貌。 4. 强制执行“验证循环” 这是提升 Agent 成功率最有效的工程手段。 · Checklist 模式:让 Claude 在执行复杂任务前,先拷贝一份清单到回复中,每完成一步打一个钩。这能防止 Claude “偷懒”跳过关键步骤。 · “运行 -> 校验 -> 修正”:在技能中包含验证脚本。 · 示例:修改 XML 文件后,强制 Claude 运行一个 validate. py。如果报错,Claude 必须根据错误信息自我修正,而不是直接报错退出。 · 让 Claude 互检:如果不用代码,也可以让 Claude 根据 STYLE_GUIDE.md 来自我审计。 5. 评价驱动开发:先写测试,再写技能 不要凭空想象 Claude 需要什么,要从失败中学习。 · 识别差距:先让 Claude 在没有技能的情况下执行任务,记录它在哪里跌倒了(例如:不知道公司的特定 API 格式)。 · 最小化补足:只编写刚好能让它通过测试的那部分技能描述。 · 模型差异化测试: · Haiku:需要更详细、直白的引导。 · Sonnet:需要高效、平衡的指令。 · Opus/4.5:非常聪明,要避免过度解释,否则它会觉得你太啰嗦而忽略重点。
分享
评论 0
0
meng shao
1周前
[开源推荐] Claude Code Router: 为 Claude Code 提供一个灵活的路由代理层。让用户在保留 Claude Code 原有界面、工具调用能力和官方持续更新的同时,将实际的 AI 请求路由到各种第三方模型提供商,实现模型解锁、成本优化、性能调整和功能扩展。 项目背景与目的 Claude Code 能力很强,但其默认依赖 Anthropic 的官方模型,面临费用较高、使用限额等问题(说白了就是贵!)。 Claude Code Router 通过本地代理服务器的方式拦截 Claude Code 的请求,根据用户配置自动或手动路由到更适合的模型(如更便宜的 DeepSeek、更快的 Groq 或本地 Ollama 等),同时保持 Claude Code 的完整体验。 主要特点 · 多提供商支持:兼容 OpenRouter、DeepSeek、Ollama、Gemini、Groq、Volcengine、SiliconFlow 等多种 API。 · 智能路由:根据任务场景自动选择模型,例如: · 默认任务 → 廉价高性价比模型(如 DeepSeek Chat)。 · 复杂推理(Think 模式) → 更强推理模型(如 DeepSeek Reasoner)。 · 长上下文 → 大上下文窗口模型(如 Gemini)。 · 后台任务、图像处理或网页搜索等专项路由。 · 请求/响应转换:内置多种 transformer,确保不同提供商的 API 格式兼容(例如工具调用、最大 token 限制等)。 · 动态切换:在 Claude Code 中直接用 /model 命令实时切换模型。 · CLI 与 UI 管理:提供 ccr model 交互式模型管理、ccr ui Web 配置界面,以及预设分享配置。 · 插件与自定义:支持自定义 transformer 和路由脚本,实现高级逻辑。 · CI/CD 集成:无缝支持 GitHub Actions,用于自动化代码审查、PR 处理等。 · 其他:环境变量激活、详细日志、非交互自动化模式。 工作原理 在本地启动一个代理服务器(默认端口 3456)。用户通过 ccr code 启动后,Claude Code 的所有请求都会被重定向到这个代理。代理根据配置文件(~/.claude-code-router/config.json)中的路由规则、transformer 和提供商设置,将请求转发到目标 API,并转换响应返回给 Claude Code,用户无需修改 Claude Code 本身,即可“自由选择”底层模型,同时享受官方功能更新。 开源地址
分享
评论 0
0
meng shao
1周前
[论文解读] 一切皆上下文:面向上下文工程的智能体文件系统抽象,用管理操作系统文件那样严谨、标准化的方式,去管理 AI 的上下文。 核心理念:AI 时代的 "Unix 哲学" 论文的标题致敬了 Unix 操作系统的经典哲学——“Everything is a file”。 在 Unix/Linux 系统中,无论是文档、硬件设备还是网络接口,都被抽象为“文件”,可以用统一的方式(如读、写、挂载)来处理。 这篇论文提出,在 AI 智能体开发中,所有的“上下文”也应该被抽象为“文件”。 · 以前的做法:提示词、外部知识库、对话历史、工具调用等都是散乱的,开发者需要用不同的方式去拼接和管理它们。 · 论文的做法:将上述所有内容(记忆、工具、知识、人类指令)都视为“文件”,通过一个统一的智能体文件系统抽象层进行管理。 解决了什么问题? 目前的 AI 开发(特别是上下文工程)面临“手工作坊”式的混乱: · 碎片化:提示词工程、RAG 检索、工具集成各自为战,缺乏统一标准。 · 不可追溯:AI 为什么输出了这个结果?到底用了哪段背景知识?很难像审计代码一样去审计“上下文”。 · 难以维护:随着对话变长、任务变复杂,上下文窗口很容易“爆炸”或丢失关键信息。 核心架构:AIGNE 框架 团队开源了一个名为 AIGNE 的框架来实现这一理念。该架构将上下文处理流程化为一条清晰的流水线,包含三个关键组件: 1. 上下文构造器 职责:像文件管理器一样,负责“挂载”和“筛选”文件。它根据当前任务,从海量的“上下文文件”中选出最相关的部分,进行优先级排序和压缩,生成一份“清单”(Manifest)。 2. 上下文加载器 职责:负责“读取”文件。它按照构造器的清单,将实际的内容加载进来,组装成最终喂给 LLM 的 Prompt。支持静态读取和流式更新。 3. Context Evaluator 职责:负责“写入”和“验证”。它检查 AI 的输出是否符合预期,并将新的交互产生的有价值信息(如用户偏好、新知识)“写入”回文件系统中,形成记忆的闭环。 实际应用案例 · 带记忆的智能体:通过文件读写的方式,让 AI 像操作日志文件一样管理自己的长期记忆,而不是单纯依赖上下文窗口的滑动。 · GitHub 助手:利用 MCP 协议,将 GitHub 仓库的代码、Issues 等抽象为文件系统的一部分,让 AI 能以标准化的方式读取代码库上下文进行辅助编程。 论文地址
分享
评论 0
0
meng shao
1周前
[开源推荐] OpenCode Debug Plugin: 专为 OpenCode 设计的调试插件,实现类似 Cursor 调试模式的功能,让 AI Agent 能够在代码中插入调试语句、捕获运行时数据并分析问题。 核心工作流程 启动调试 → 插入监控代码 → 运行程序复现问题 → 读取分析日志 → 清理代码 1. debug_start:启动本地 HTTP 服务器,等待接收调试数据 2. 自动插桩:AI 在关键位置插入 fetch() 调用 3. 复现问题:你运行程序,触发 bug 4. debug_read:AI 读取捕获的运行时数据 5. debug_stop:AI 清理所有插入的调试代码 主要特性 · 运行时数据捕获:监控函数输入输出、状态变化、错误信息 · 本地调试服务器:HTTP 服务接收调试事件 · Ngrok 隧道支持:可暴露为公网 URL,调试远程/部署环境 · 持久化日志:所有事件保存到 .opencode/debug.log · 智能清理:停用时自动移除所有插桩代码 开源地址
分享
评论 0
0
meng shao
1周前
Flappy Bird ? Foldy Bird !!! 哪个天才想出来的玩法,折叠屏手机折叠改变小鸟飞行高度,折叠屏手机厂商测试员都不舍得这么测啊 😂 不知道「Foldy Bird」 这个游戏榜首的朋友,折坏了多少部手机 📱 有折叠屏朋友想试试吗:
分享
评论 0
0
meng shao
2周前
今天身边发生了一个中年失业、借贷假装工资、被电信诈骗、骗家人变卖首饰,长达三年后直到妻子二胎怀孕,终于说漏嘴,逼问之下说出所有事实,最后选择送外卖这种最实际的工作来还债。 听完之后还是很久都不能平静,因为年龄相仿、孩子年龄也相仿,我们大人跟孩子都是很不错的朋友。虽然我们一起凑钱还上了几十万的网贷,但这些年的欺骗,家庭关系的信任裂痕如何修复,真的不是还钱可以一次性解决的问题了。 事情的起因从 TX 某软件开发外包开始,当时他们也在深圳,后来想回老家发展,不过老家是不太可能找到 IT 类工作的,所有就和外包团队谈好了远程工作,这位朋友还是很全面的程序员,前后端都能做,也能自己做项目经理和商务,所以回老家后刚开始远程工作还是顺利的。 直到三年前,外包团队裁撤,他被裁员了,可能因为远程?年龄?不太清楚了。但他不想因为自己被裁影响家里生活,所以就隐瞒没说,还是照常每天坐在电脑前,想着自己的办法来挣钱,不过确实挣不到什么,除了游戏代练之类能有一点点收入,就没其他了,距离外包工资肯定是有很大差距的,所以他不知怎么得就接触到了网贷,一贷就是三年,这中间又因为急于想赚到钱,接触到了电信诈骗团队,并「成功」被骗了,确实,电信诈骗利用的就是咱们急迫和不理智的状态,这样各种利息滚下来,三年就欠了好几十万。 中间因为有一些网贷等要还,还编造过外包团队泄密,被 TX 罚款,他是主要负责人,所以要负责 10+ 万赔偿的谎言,从家里拿出和变卖家人首饰凑钱赔偿。现在才知道,只是网贷的一部分。 ... 后面的细节就不多说了,被发现后大家肯定是情绪都很低落,充满了争吵、愤怒和伤心,又赶上妻子刚刚怀二胎,也真是遭了罪了 ... 唯一的安慰是至少通过大家凑钱还能还,他还有劳动能力,可以送外卖慢慢攒钱,也不是完全不可挽回,家庭关系还有修复的机会,希望后面一切都能好转吧。 想想很是为他们可惜,一步走错后面都在为这一步补偿,更何况是一步走错 + 谎言隐瞒,后面只能越来越早。也是很唏嘘,中年人如果把生活的收入都压在工作的工资上,实在太被动了,都别说他是回了小城市完全没有工作机会,即使是在一线城市,一旦突然被辞退裁员,中年人找工作,也是很 tm 艰辛的。 所以也坚定了我要做一份自己的事情的决心,不管大小,它是可以让我不依赖于某个公司 某个城市和某种生活方式的,只要我自己还在就行,即使刚开始这件事情很小,但它是可以积累的,这种积累都是我自己的,而不是公司和城市的,坚持做下去,总有做得更大,能独立负担家庭生活的那一天。 2026年开始了,大家共勉,做好自己的事业,不管是兼职还是全职投入!
分享
评论 0
0
meng shao
2周前
趁机再给大家推荐我的多张图信息卡提示词: 小红书和公众号,关注「AI启蒙小伙伴」
分享
评论 0
0
meng shao
2周前
如果你告诉我小扎团队还在用心做 Facebook,我是不敢相信的。 比如今天收到的生日邮件,在我39岁第一天,居然收到39年前的Facebook记忆吗? 虽然它的本意可能是告诉我39年前出生,虽然。。这个账号我注册Facebook后啥也没做就早已经被封了,甚至没来得及发任何一条帖子 😂
分享
评论 0
0
1
2
3
4
5
6
7
8
下一页
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞