九原客

统计数据

42
文章
0
粉丝
0
获赞
216
阅读

热门文章

1

TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...

145 32
avatar
九原客
2周前
不用在Claude md 中维护规则文件索引了,claude code 已经支持rules。
avatar
九原客
3周前
认同这个CLAUDE md 实践,就两条: 1. 保持简短(不超过60行) 2. 将复杂的指令放到单独目录下,然后在 CLAUDE md 中增加索引(类似于 SKILL 的概念)
avatar
九原客
1个月前
暴论:模型服务商应该只提供 completion 接口,甚至连 chat completion 都不提供,更别说 Response API、Anthropic 的beta 特性等等。 这些统一 client/sdk 实现~
#模型服务商 #completion接口 #chat completion #Response API #Anthropic
avatar
九原客
1个月前
我最近模型选择和国产平替 AI Coding: 最佳:Claude Code + Opus/Sonnet 平替:Claude Code + GLM-4.6/Kimi-K2-Thinking/Minimax-M2 专业写作: 最佳:GPT-5.1 thinking 平替:Kimi-K2 thinking DeepResearch: 最佳:Gemini DeepResearch 平替:国内的产品都做的很烂,主要是搜索的信息源不行。
#AI Coding #Claude Code #GLM-4.6 #Kimi-K2-Thinking #MiniMax-M2
avatar
九原客
1个月前
了解 Claude Code 设计的办法就是看它的 Prompt,比如最近新增了两个Tool(EnterPlanMode和ExitPlanMode) 可以在 .claude/plans 目录下写Plan了。
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#Claude Code #Prompt #EnterPlanMode #ExitPlanMode #.claude/plans
avatar
九原客
1个月前
Qwen 的模型哪怕是最强的 Qwen3-Max 也不是今天才发布,怎么千问 App 突然就效果特别好了呢。 好难猜啊。
深度学习模型升级引发AI能力大跃进,行业迎新变革· 143 条信息
#Qwen #Qwen3-Max #千问App #模型效果 #猜测
avatar
九原客
1个月前
Anthropic 也意识到堆砌冗长的MCP Server 非常干扰上下文,一加载就是一堆 tools,有时我不得不将其wrap成本地工具。 但是这个code with mcp 怎么和已有的Agent 流程打通是很大的问题。 Filesystem is all your need。
#多智能体之争:Anthropic生态VS单智能体· 81 条信息
#Anthropic #MCP Server #Agent流程 #Filesystem #tools
avatar
九原客
1个月前
踩了下 Claude Agents SDK 的坑,这个 SDK的文档写的不太好(我感觉可能有AI生成的成分) 按照文档的意思,会和Claude Code一样自动读取 .mcp.json 文件,但是实际测试需要配置,否则不会生效。
Claude Skills系统发布引发AI行业新变革· 66 条信息
#Claude Agents SDK #文档质量 #配置问题 #AI生成 #负面评价
avatar
九原客
1个月前
画了一个简单的专利写作智能体的架构,供参考。用Claude Code 等实现也很简单,就用 Agent-SubAgent,写提示词,提示词可以让 Claude 帮你写。
Claude Skills系统发布引发AI行业新变革· 66 条信息
#专利写作 #智能体 #Claude Code #Agent-SubAgent #提示词
avatar
九原客
2个月前
Meta 竟然在裁田渊栋,发完求职推后,OpenAI、XAI、Anthropic等等都在喊 Join us。 倒是想知道他们的TBD到底能憋出来啥,也四个月了吧,以Meta的算力模型该训出来一版啦。 闭源比开源更残酷,效果没亮点没人会用的,现在US的闭源模型就剩四五家了。
#Meta裁员 #田渊栋 #OpenAI #闭源模型 #AI求职
avatar
九原客
2个月前
Paddle OCR 确实很久以来都是中文OCR的头把交椅。新的VLM模型也出来了,可以试试。
智谱直播发布全球最佳视觉模型GLM-4.5V,挑战AI视觉领域极限· 21 条信息
#Paddle OCR #中文OCR #VLM模型 #技术 #测评
avatar
九原客
2个月前
看来还是CLI 好做,阿里光Claude Code 竞品就由三个团队分别做了三个。 iFlow CLI、Qwen CLI、Qoder CLI。
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#CLI #阿里 #Qwen #iFlow #Qoder
avatar
九原客
2个月前
如果对 DeepResearch 这类复杂的 Agent 感兴趣,我建议学一下LangGraph的免费课程 Deep Research with LangGraph。 课程比较循序渐进,先做一个单Agent系统,然后进化为多 Agent。 最主要是架构简单,外部依赖非常少,一个大模型一个搜索API就完了。
谷歌Deep Research:AI操作系统雏形?· 145 条信息
#DeepResearch #LangGraph #agent #大模型 #搜索API
avatar
九原客
2个月前
对的对的,我发现Claude Code 特别爱编写防御性代码。 而我是异常神教信徒,秉持不做异常处理,错误就要抛出的观点。 Error early Error fast
#Claude Code #防御性代码 #异常神教 #错误处理 #Error early Error fast
avatar
九原客
2个月前
尝试了很多内网穿透的办法(tailcale等)最后发现还是买一台国内云上的虚拟机,然后用frp映射22端口,上vscode remote 最稳。 只是要注意安全性,关闭密码只用密钥。
#内网穿透 #frp #vscode remote #安全性 #密钥
avatar
九原客
2个月前
只需要一个While循环,让Claude 无限运行。(之前我也用了这招,好用!) while :; do cat | claude -p --dangerously-skip-permissions; done prompt也很简单: Your job is to port assistant-ui-react monorepo (for react) to assistant-ui-vue (for vue) and maintain the repository. You have access to the current assistant-ui-react repository as well as the assistant-ui-vue repository. Make a commit and push your changes after every single file edit. Use the assistant-ui-vue/.agent/ directory as a scratchpad for your work. Store long term plans and todo lists there. The original project was mostly tested by manually running the code. When porting, you will need to write end to end and unit tests for the project. But make sure to spend most of your time on the actual porting, not on the testing. A good heuristic is to spend 80% of your time on the actual porting, and 20% on the testing.
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#Claude #无限循环 #代码移植 #React到Vue #自动化开发
avatar
九原客
3个月前
Kimi官方对OpenRouter上不同的供应商的 Tool Calling能力做了Benchmark,发现有些供应商提供的模型服务有较大问题。 可能是推理Bug,也可能是不合理的量化。 另外 1. 使用的2000条Tool Calling 测试集没有开源。 2. 可以在 OpenRouter配置中排除掉某些供应商。
#Kimi #Openrouter #tool calling #Benchmark #模型问题
avatar
九原客
3个月前
文档识别模型,我一般就用这个图测试。 大家可以猜猜哪个模型最好,也可以自己测试下。
#文档识别 #模型测试 #模型对比
avatar
九原客
3个月前
目前个人测试中文效果最好的 端到端文档识别小模型 是腾讯的 POINTS-Reader(比小红书的dots.ocr 还要好一些)。 做了如下小小的工作: 1. 合并了官方的PR到sglang 0.5.3 版本,可以高效推理。 2. 基于TRL的模型训练代码,可以进行训练。训练只需要图片和对应的markdown文本。
深度学习模型升级引发AI能力大跃进,行业迎新变革· 143 条信息
#腾讯 #POINTS-Reader #文档识别 #小模型 #sglang
avatar
九原客
3个月前
推荐一个LLM数据集处理、合成、过滤用的库:DataFlow。用在最近多个模型训练数据集处理过程中,最大处理100M条SFT语料。 优点是封装较少,代码简洁明了(相比于类似的其他库),可以方便复用算子和自定义算子。 缺点是预设算子有些性能上、模型上还是需要定制,好在结构简单定制很快。
#LLM #数据集处理 #DataFlow #模型训练 #SFT语料
avatar
九原客
3个月前
免费 GPU 或廉价算力推荐,可用于学习10B以内模型微调训练,我会给学员推荐这些环境练习模型训练。
#免费GPU #廉价算力 #模型微调训练 #10B模型 #学员推荐
avatar
九原客
5个月前
Vibe Coding 心得 - 正式项目(需要持续维护的),每次只生成少量代码+人工Review。 - 一次性项目。人工确定选型(包括框架、依赖库等)和设计后,使用vibe coding 完成。放下代码完美主义,能跑就行。 三生不幸,来做ToB,不需要讲什么可维护性,完美适合vibe coding。
avatar
九原客
5个月前
问数先不提技术的坑,就说最本质的目标客户。 如果给不懂SQL的业务部门(or领导)使用且自由提问,核心问题是无法信任模型输出,且不懂SQL也无法核查正确性。 问答也有类似问题,但有引文做信任基础。 现在 Text2SQL 更多还是辅助数据工程师,减少工作量,而不是做成终端产品交付给业务部门。
avatar
九原客
5个月前
有人指控Pangu Pro MoE 模型其实是沿自Qwen2.5-14B(大小不一致没关系,可以通过复制参数的方式实现) 几个证据: 1. 毫无理由出现在Pangu Pro MoE代码库里的Qwen License 2. QKV偏置分析、激活值分布特征等统计结果 3. 架构和超参数的选择 建议自high可以,谨慎开源。
avatar
九原客
5个月前
(1/3)【论文推荐】DeepResearch 是我最近研究的重点方向,推荐3篇文章: (好一些的综述) (过于求全反而缺乏洞见的综述) (评估方法,从报告质量和引用精度两个角度评估)
© 2025 news.news. All rights reserved. 0.03677 秒. v1.0.46
我的评论