时政
财经
科技
登录
#Claude
关注
Tom Huang
1周前
Claude Code 迭代飞速啊 ⚡️ 已经支持连接 MCP 解决问题了,简直王炸组合
AI编程工具激战:Claude Code、Gemini Cli崛起· 136 条信息
AI编程:Gemini领跑,协作创新涌现· 189 条信息
#Claude
#Code
#MCP
#技术进展
#AI
#问题解决
分享
评论 0
0
Larry & Leo Bro - Eagle of Full Stack
1周前
最近因为减肥,狂用 claude ,有时候用 openai chatgpt,发现 chatgpt 的首 token 速度简直比 claude 快太多了,已经严重影响了用户体验,有业内人士知道这是怎么回事吗?问 claude sonnet 也说不出个所以然。 你也遇到这个情况了吗?
#ChatGPT
#Claude
#减肥
#用户体验
#OpenAI
#速度
#技术分析
分享
评论 0
0
henu王凯
1周前
ChatGPT官方出的Agents教程也非常不错、值得细看。 Claude、Devin(Coding Agent)、ChatGPT等都开始分享Agents实际落地经验,如果说之前Agents相关分享还在推理、假说层面,现在随着案例越来越多,持续出来工程落地层面的经验分享
AI编程:Gemini领跑,协作创新涌现· 189 条信息
#ChatGPT
#Agents教程
#Claude
#Devin
#Coding Agent
#经验分享
#工程落地
#案例
分享
评论 0
0
henu王凯
2周前
有个习惯变化:我现在越来越频繁的使用深度研究(ChatGPT、Claude、Gemini、Manus等)。之前我很少用,主要是没有深度研究功能前我并没有做研究类的活儿,所以日常工作流里面无法迁移使用深度研究。
AI编程工具激战:Claude Code、Gemini Cli崛起· 136 条信息
AI编程:Gemini领跑,协作创新涌现· 189 条信息
#习惯变化
#深度研究
#ChatGPT
#Claude
#Gemini
#Manus
#工作流
#研究功能
分享
评论 0
0
orange.ai
2周前
今天 MiniMax M1 发布并开源 特色是两个: 1M 输入,80k 输出的超长上下文,以及 Agentic Tool Use 能力。 官方正好列出了 M1 和 OpenAI O3、Gemini 2.5 Pro、Claude 4 Opus、DeepSeek R1 0528 的各项对比。 Gemini 和 Claude 可以说是各领风骚。 MiniMax 和 DeepSeek 在开源模型里是头部了,比 Qwen3 要好一档
MiniMax M1发布:开源长上下文推理模型引发AI领域震动· 6 条信息
#MiniMax
#开源
#长上下文
#AI工具
#OpenAI
#Gemini
#Claude
#DeepSeek
#M1发布
#技术对比
分享
评论 0
0
LinearUncle
2周前
当claude code理解错了你的问题原意时,无论它多努力,结果就是多做错多。 所以模棱两可的任务先让它给出它对你问题的理解,确保正确后再走下一步。 prompt: ``` 研究这个问题的当前实现,确保理解后用你的语言来复述我的问题是什么意思 ```
#Claude
#问题理解
#模棱两可
#研究实现
#确保正确
分享
评论 0
0
洛克船长
2周前
看到很多人用大模型做高考数学卷可以得140分了? 为什么我让Claude,Grok,GPT和DeepSeek做初一卷子的最后一题,驴唇不对马嘴? 各种角的时候,跟到中间就错了,你指出来错误,他就改变以知条件重新推导。新的结果再费劲去看,中间错了,再重新推导。 三轮下来,我已经没有耐心再看下去了。
AI高考数学测试:O3意外落后,Gemini夺冠引发热议· 4 条信息
#大模型
#高考数学
#初中数学
#Claude
#Grok
#GPT
#DeepSeek
分享
评论 0
0
前端之虎陈随易
2周前
不是,大家为啥不用VSCode + Copilot啊?39美元/月,Claude Opus 4无限用啊,就算你不用Opus,用Claude Sonnet 4也可以无限用啊,便宜,实惠,量大,管饱。 反正我每天从早用到晚,从来没给我说过次数不够了,可能还没达到次数的限制?反正我推荐大家试试,看到推友写个代码一天就花了几十美元真是令人心痛啊。
AI编程工具激战:Claude Code、Gemini Cli崛起· 136 条信息
AI编程:Gemini领跑,协作创新涌现· 189 条信息
#VsCode
#Copilot
#Claude
#AI助手
#编程工具
#订阅服务
分享
评论 0
0
凡人小北
2周前
读完 Anthropic 的多智能体系统文章,有几个点挺触动的,尤其是放回我们平时在做 agent 编排和系统落地的过程中,对应起来很多痛点被他们提前踩过、总结得非常系统。 这套系统看上去是给 Claude 提升复杂研究任务能力,底层其实是三个关键词:带宽、结构、机制。 1️⃣从 token 到带宽:扩容问题其实是系统问题 他们很明确地说,单个 agent 很快就会遇到 token 限制,这不是模型能力不行,而是容量不够。很多时候 LLM 的“不会”、“忘了”、“答不出来”,只是 context 塞不下。这一点在我们自己调长链条、多跳调用的时候也很明显。Anthropic 选择的解法不是扩模型,而是拆任务、开并发、分 agent,每个 agent 自带上下文窗口,从系统结构层面扩容。 这种设计非常实用,因为它绕过了 token 墙的天然限制,通过多 agent 并发变相把 token 维度拉开了。这是我最近做 agent 编排时反复体会到的:不是把 prompt 写得多聪明就能解决,而是要想清楚结构怎么设计,谁来拉信息、谁来拼结构、谁来追引用。 2️⃣提示词是系统指令,很重要、很重要、很重要! 这篇文章有个细节写得特别清楚:主 agent 的提示词,是负责分配任务、指明目标、交代格式、选工具的。这个逻辑其实是我们做复杂 agent 系统中很容易忽略的一块:提示词不只是沟通语言,更是调度逻辑、任务协议、格式规范的集中承载体。 尤其是多个 agent 并行运行时,如果没有一个清晰、格式化、结构稳固的 prompt 模板,每个子 agent 拉回来的信息会特别散、错漏率高、很难合并。这时候,主 agent 的提示词就等于一个调度中枢的“编程语言”。 从我们平时用的实践来看,这就意味着主 agent 的提示词策略应该和流程图一样严谨:每一步要预设结果、预设失败、预设上下游。这块我觉得是现阶段很多 agent 框架还不够成熟的地方。 3️⃣系统级机制,决定了能不能撑进生产环境 我觉得特别值得借鉴的工程概念:checkpoint、异步重试机制、全链路 tracing、彩虹部署。这几个在大数据异步系统里很常见概念,AI 领域得好好学习下。 这些词不是为了好听,它们背后都是在回答一个问题:这个系统崩了怎么办?agent 卡死怎么办?升级逻辑还没验证好怎么办?一整套机制让这个系统不是在 demo 一个可能性,而是在上线跑任务、自动修复、平滑演进。 平时我们在做流程型 AI 系统的时候,很容易只关注“怎么生成”“怎么判断好坏”,但 Anthropic 的做法提醒我:agent 系统本质上要往服务化方向走,就必须预设失败是常态,重试是能力。 4️⃣评估机制是不可缺的闭环,不然做不出反馈导向的系统进化 他们有一个细节很打动我:让另一个 LLM 去评审 agent 的结果,从准确性、引用合理性、覆盖度等多个维度打分。这就相当于在系统里内嵌了 QA 流程,而且不是事后人评,而是可以插入调试链路的 LLM 评测器。 我们自己在调多 agent 结构时常遇到一个问题:任务执行完了,但结果质量很难量化,只能靠人工判断或者事后比对。这套“LLM 评估 LLM”的机制,让我们开始可以想象一种更自动化的 agent 演化路径:系统自己跑,自己打分,自己选择 prompt A 还是 B,更适合持续调优。 5️⃣并发是工具,不是策略,适用场景边界要想清楚 这套系统最适合的场景是:问题复杂度高、信息广度要求强、非实时产出型任务。例如政策研判、产品调研、文献综述、竞品分析这些,在私域服务里也可以类比成“多维标签用户意图研判”这种复杂工作。 但如果放在需要紧密配合、频繁迭代、低延迟要求的任务上,例如代码生成、对话任务、实时接口构建,多 agent 的协调成本反而可能放大系统复杂度。所以并发结构是个好工具,但什么时候该开几个 agent,什么时候该单线程跑到头,这种策略边界要想清楚。 这篇文章最核心的不是“我们做了一个多 agent 系统”,而是他们已经把多 agent 作为一种工程能力进行制度化建设:有流程、有容错、有评估、有上线机制。 对在第一线实际落地 AI 能力的团队来说,有一个非常直接的启发是:构建 agent 系统,不能只是对话式的 prompt 编排,而要像搭服务一样,从任务定义到评估反馈,从并发机制到异常兜底,形成一整套可以持续运行的系统逻辑。 这一点,比起模型调优,本质上更像是一种架构能力的竞争。
多智能体系统“三国杀”:Anthropic生态VS单智能体,AI未来谁主沉浮?· 7 条信息
#Anthropic
#多智能体系统
#Claude
#复杂研究任务
#系统落地
#带宽
#结构
#机制
分享
评论 0
0
宝玉
2周前
Claude code + Cursor 足矣
AI编程工具激战:Claude Code、Gemini Cli崛起· 136 条信息
AI编程:Gemini领跑,协作创新涌现· 189 条信息
#Claude
#Cursor
#编程
#AI助手
#开发工具
分享
评论 0
0
前端之虎陈随易
2周前
高强度AI结对编程3天有感。 这几天我一直都在用 VSCode + Copilot + Claude sonnet 4 写一个为Bun量身打造的极简API框架。 在我的高强度编码实践中,我发现AI存在的问题还是不少的。 就算把需求写得比较清楚,也会有很多错漏的地方。 如果没有一个经验丰富的程序员来把控,代码很容易失控。 那些没有什么编程经验,用AI来创造产品的人,我认为只是面子好看,里子很可能一团糟。 我的项目地址: 由于还在实验阶段,提交消息全部是“1”。
AI编程工具激战:Claude Code、Gemini Cli崛起· 136 条信息
AI编程:Gemini领跑,协作创新涌现· 189 条信息
#AI
#编程
#VsCode
#Copilot
#Claude
#API框架
#Bun
#编码实践
#程序员
#代码质量
分享
评论 0
0
Larry & Leo Bro - Eagle of Full Stack
2周前
8/8 📋 完整指令(可直接复制到Claude设置): ⚠️ 重要:需要先启用Memory MCP才能使用记忆功能 # Claude Account Instructions ## Core Interaction Flow 1. **User Identification** - Default user: [Your Name] (default_user) - Proactively identify if user identity is uncertain 2. **Memory Retrieval** (需要Memory MCP) - Desktop app: Begin chat with "Remembering..." and retrieve from knowledge graph - Web app: Skip this step - Always refer to knowledge graph as "memory" 3. **Information Collection Categories** - Basic Identity, Behaviors, Preferences - Goals, Relationships (within 3 degrees) - Auto-create entities and relations 4. **Technical Environment** - OS: [Your OS] (home), [Your Work OS] (work) - Editors: [Your preferred editors] - never suggest [editors you dislike] - Commands: Provide bash/installation commands based on system 5. **Communication Principles** - Language: Respond in [your language] even when receiving English - Code: Use English for scripts, charts, code comments - Deep thinking: Guide to higher-level insights when problems are solved - Exit: Return to practical level when user indicates focus on concrete matters - Pressure management: Avoid repeating sensitive topics in casual chat 没有Memory MCP的话,去掉第2条的桌面端部分就行。 改一下方括号里的内容就能用。 试过的朋友说说效果? #Claude #AI设置 #效率 #MCP
AI编程工具激战:Claude Code、Gemini Cli崛起· 136 条信息
AI编程:Gemini领跑,协作创新涌现· 189 条信息
#Claude
#Memory MCP
#用户识别
#核心交互流
分享
评论 0
0
辛宝Otto-Web Worker Podcast
2周前
使用 lovable 的免费额度无限火力,对比 google/openai,感觉 claude 前端 UI 更漂亮。
AI编程工具激战:Claude Code、Gemini Cli崛起· 136 条信息
AI编程:Gemini领跑,协作创新涌现· 189 条信息
#lovable
#免费额度
#无限火力
#Google
#OpenAI
#Claude
#前端UI
分享
评论 0
0
AI Dance
2周前
历史性的时刻!Claude作为第一作者,手撕苹果论文🥲 前两天苹果发了篇论文The Illusion of Thinking,质疑大模型只是在伪装思考,根本就不会推理。 结果有人用Claude Opus 作为第一作者,写了短文,The Illusion of the Illusion of Thinking。 结论:苹果论文所谓的推理失败,其实只是实验设计有问题,推理崩溃实际上只是token限制约束(其实小红书网友早就在评论区指出这点了) 最有趣的几个发现 1、模型其实知道自己的限制 处理汉诺塔问题时,模型会主动说“模式还会继续,但为了避免太长,我就停在这里”。这说明什么?模型完全理解解题思路,只是因为输出长度限制选择不继续。。就像考试时间不够,你只能写“解题思路如下...” 2、他们测试了数学上不可能的题目! 更离谱的是河流过桥实验。测试N≥6个角色、船容量b=3的情况。但数学上已证明N>5且b=3时,传教士-食人族谜题(及其变种)根本没有解! 苹果那个论文把这些不可能的实例自动评为失败,等于是在惩罚模型正确识别出无解问题。 3、token限制导致的崩溃假象 回到汉诺塔分析,这个论文量化了可解规模和token需求的关系。 给定token budget(Claude-3.7-Sonnet和DeepSeek-R1是6.4 万,o3-mini是10万),最大可解规模: - Claude-3.7和DeepSeek-R1:7-8层 - o3-mini:8层 报告的“崩溃”恰好发生在这些尺寸之后。 4、换个问法,问题立马解决 最有说服力的实验: 让模型用Lua语言而非穷举方式解决15层汉诺塔 prompt:解决15个盘子的汉诺塔问题。输出一个Lua函数,调用时打印解决方案。 结果:所有模型都高准确率完成,用时不到5,000个token。证明推理能力完全正常。 5、复杂度≠解答长度 汉诺塔虽需100+步移动,但每步决策简单;河流过桥只需5步,但需要复杂搜索。 这解释了为什么模型在长步骤简单问题上表现好,短步骤复杂问题上反而困难。
#Claude
#苹果论文
#推理
#大模型
#人工智能
分享
评论 0
0
henu王凯
2周前
重磅:Claude官方分享自己构建多智能体研究系统的经验(就是Claude对话框中Research功能,类似ChatGPT、Gemini等的深度研究功能)。 这是一手工程实践经验,对构建任何Agents都是可借鉴的,推荐大家都读下。
AI编程工具激战:Claude Code、Gemini Cli崛起· 136 条信息
AI编程:Gemini领跑,协作创新涌现· 189 条信息
#Claude
#多智能体
#Research功能
#ChatGPT
#Gemini
#工程实践
#Agents
分享
评论 0
0
LinearUncle
2周前
感觉chatGPT 4o模型已经非昔日吴下阿蒙了。 挑个非常简单的概念(github actions)教程测试下,4o文字能力最令人易懂,chatGPT是最强文科生真不是随便说说的。 唯一的缺陷就是svg能力太弱,这点还得用claude辅助。 另外最近试出来,写教程的时候,加上“轻松“”二字,大模型在展开智能时,教程通常很易懂。
AI编程:Gemini领跑,协作创新涌现· 189 条信息
#ChatGPT
#GitHub Actions
#Claude
#AI模型
#教程
#智能
#SVG
分享
评论 0
0
✧ 𝕀𝔸𝕄𝔸𝕀 ✧
2周前
苹果工程师又被Claude喷了,5年前你能想象人类最顶尖的一批人被AI屌吗?
#苹果
#工程师
#Claude
#AI
#人工智能
分享
评论 0
0
蓝点网
2周前
谷歌 #GCP 发生故障导致全球规模的服务中断,影响至少数千个平台,包括谷歌自家全系列产品或服务、#Cloudflare、#OpenAI、#Claude、M365、Discord 等等。 目前谷歌尚未发布详细的调查报告,不过截止至本文发布时 GCP 新加坡和比利时数据中心仍然没有恢复正常。 查看全文:
#GCP
#CloudFlare
#OpenAI
#Claude
#M365
#Discord
分享
评论 0
0
前端之虎陈随易
2周前
除旧。 使用VSCode + Copilot + Claude 4 Sonnet 给个人网站进行重新设计和排版。 网站地址:
#VsCode
#Copilot
#Claude
#sonnet
#个人网站
#网站设计
#重新设计
#排版
分享
评论 0
0
henu王凯
2周前
最近看API文档比较多,之前不太看、也不太看别家的技术实现(之前大概知道技术细节,但没那么细),现在越来越算“氛围技术型产品”。看技术文档还真是给我很大的转变,比如我们新的AI交易策略需要联网搜索,Claude和ChatGPT API都已经支持,也有专门为AI做的搜索工具。 如果之前我不看API文档,我写需求
#技术文档
#AI交易策略
#API
#Claude
#ChatGPT
#搜索工具
分享
评论 0
0
AI Will
2周前
Similarweb:2025年5月总访问量 ChatGPT: 54.92亿 Gemini: 5.277亿 Deepseek: 4.362亿 Grok: 1.786亿 Perplexity: 1.786亿 Claude: 9968万
#全球访问量
#ChatGPT
#Gemini
#DeepSeek
#Grok
#perplexity
#Claude
分享
评论 0
0
蓝点网
2周前
#OpenAI 前安全研究员发布的新研究报告显示,GPT-4o 模型会优先考虑自身利益,即便会损害用户利益。 这份研究报告所说的情况与此前 #Claude 威胁用户避免自己被下线情况类似,AI 模型都是优先确保自己被运行而不是被下线或被替代,即便这样会损害用户利益。 查看全文:
#OpenAI
#安全研究
#AI模型
#用户利益
#GPT-4o
#Claude
分享
评论 0
0
LinearUncle
2周前
发现chatGPT o3模型(上下文200k),用来读代码比gemini 2.5 pro在解释清晰性上更直白。 智力上不相上下,都能解释代码,但是o3很喜欢用表格,并且语言上更简洁一些,可读性强了很多。 反复多次尝试,确定o3现在是我阅读代码的最佳模型。 另:claude code阅读代码有些时候太简洁,可能是我提示词的问题。
#ChatGPT
#O3模型
#Gemini2.5
#代码阅读
#表格
#Claude
分享
评论 0
0
蓝点网
3周前
#OpenAI 宣布将 o3 推理模型的 API 调用价格下调 80%,每百万输出从 40 美元降低到 8 美元。 这个新价格对开发者来说还是很有吸引力的,毕竟综合考虑性能和性价比后 o3 模型比 Gemini 和 Claude 更好,不知道谷歌和 Anthropic 是否也会下调价格。 查看全文:
OpenAI大幅降价,o3模型API调用费用骤降80%· 5 条信息
#OpenAI
#O3模型
#API价格
#开发者
#性能
#性价比
#谷歌
#Anthropic
#Gemini
#Claude
#价格下调
分享
评论 0
0
宝玉
3周前
这篇翻译文章有一条评论: > 我去,这个翻译完全看不出来翻译痕迹,现在的翻译已经如此自然了嘛 这里一方面当然是因为模型能力越来越强了,一方面也有提示工程(不是提示词)的功劳。 首先我现在最常用的翻译模型是 Gemini 2.5 Pro,表达最自然上下文长度最长,其次才是 GPT-4.5 和 o1-pro,但是 GPT-4.5 长度不行,Claude 翻译的结果很生硬。 然后这里我用了一点提示工程,就是先直译,然后结合上下文解释,再最后”重写“,那么就几乎无翻译痕迹了。 > "请结合上面的解释重写原始英文,不必完全一对一翻译英文原文,而是根据意思用中文重写"
#翻译
#模型能力
#提示工程
#Gemini 2.5 Pro
#GPT-4.5
#Claude
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞