时政
财经
科技
虚拟货币
其他
登录
智能推荐信息源
李老师不是你老师
关注
德潤傳媒
关注
悉尼閑人
关注
联合早报 Lianhe Zaobao
关注
DW 中文- 德国之声
关注
ABC中文
关注
Gancheng Wang
关注
Ignatius Lee
关注
《议报》
关注
网易新闻-红星新闻
关注
由 AI 根据您的兴趣偏好筛选
事件跟踪
热点事件
最新话题
实时新闻
yihong0618
2个月前
跟 LLM pair 写代码请谨慎使用~ 这个符号。
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#LLM
#pair programming
#代码
#谨慎使用
#~ 符号
分享
评论 0
0
WY
2个月前
Claude Skills可能走对路了 前天Anthropic发布了Claude Skills,这是一种让AI获取新能力的全新机制。很不错的设计,包含了软件两个最主要的组成部分:程序和资源,还没有什么别的复杂性。架构看起来很合理,虽然要实际用用才能感觉出来是不是真的好用,但初步从架构设计看,感觉Claude Skills在方向上可能走对路了,整个AI行业可能走对路了。 简洁的力量:程序+资源就够了 Skills的核心概念非常简单:一个Skill就是一个文件夹,包含指令、脚本与资源。具体来说,每个Skill包含三样东西:指令(Instructions)告诉Claude该做什么、脚本(Scripts)执行具体任务、资源(Resources)提供模板和辅助内容。因为自然语言也是代码,指令和脚本其实是分不清的,都属于程序。 这种设计的合理之处在于它抓住了软件的本质。软件不就是程序和资源吗?程序负责逻辑,资源负责数据和素材。Skills把这两者有机结合,又没有引入什么别的复杂性。 更重要的是Skills的按需加载机制。Claude只会在Skill与当前任务相关时才会调用,并且采用渐进式披露:先加载元数据(约100词),再加载主体(也比较小),最后才是具体的资源文件。这种设计既高效又节省token,体现了对成本和性能的深度考量。 AI能力扩展的演进:从Plugin到Skills 要理解Skills的价值,需要回顾OpenAI和Anthropic在AI能力扩展上的探索历程。 OpenAI的Plugin是第一次尝试,但看起来是不成功的尝试。Plugin主要依赖API调用,虽然概念不错,但实际体验并不理想,很快就被弱化了。后来推出的GPTs允许用户定制AI的知识和行为,但本质上仍然是基于提示词工程的定制,缺乏真正的能力扩展。 最新的Apps则希望把第三方的界面直接嵌进来,感觉步子迈得有点大。让AI直接操作第三方应用的界面,这种computer use式的方案虽然听起来很酷,但实际可控性和可靠性都面临巨大挑战,而且第三方应用也不愿意被嵌入的这么深。百度很多年前想做框计算,目的是类似的,并没有成功。 Anthropic自己推出的MCP(Model Context Protocol)走的是另一条路,主要通过API调用已有服务的能力,和Skills的定位不同。MCP更多是为了连接外部系统和服务,而Skills则是为Claude赋予新的原生能力。 相比之下,Skills找到了一个更优雅的平衡点。它用Markdown这种人人都能理解的格式来描述能力,可以包含详细的使用说明和示例。开发者创建一个Skill,就像是"给Claude写一份入职手册"。而且Skills可以打包分享,形成开放的生态系统,这大大降低了开发门槛。 Anthropic一口气开源了20多个Skills,涵盖创意设计、开发技术、企业应用等各个领域。这种开放的姿态,很可能会推动一个繁荣的Skills生态的形成。资源的例子很好理解:Canvas-fonts包含很多字体文件,这样Claude在生成设计时就能直接调用。 仍需改进的地方 当然,任何新技术都不可能完美。Skills目前也存在一些明显的不足。 首先是技术门槛问题。虽然Skills用Markdown编写降低了理解难度,但官方的一些Skills仍然依赖于apt-get这样不够亲民的指令,至少对大多数Windows的用户这一步就直接挂了。普通用户希望的是一个软件包一装就灵,而不是还要装一大堆依赖。如何让Skills的创建和使用更加大众化,是Anthropic需要继续优化的方向。 其次,Skills看起来不容易拥有自己的存储和数据库。这在处理需要持久化状态的任务时可能会成为限制。比如,如果我想创建一个帮我跟踪工作进展的Skill,它需要记住之前的任务状态和历史数据,但现在的Skills架构似乎不太支持这种场景。不过或许可以在Skill里调用sqlite这样的数据库命令来实现这一点? 结语 Claude Skills的发布,为AI能力扩展提供了一个简洁而优雅的解决方案。相比OpenAI的Plugin、GPTs和Apps等尝试,以及Anthropic自己的MCP,Skills在易用性、可控性和生态开放性之间找到了更好的平衡。它避免了过度工程化的陷阱,用最小的复杂度实现了核心价值。 在AI原生应用的探索中,我们都在寻找那个平衡点:既要充分发挥AI的能力,又要保持用户体验的简洁流畅;既要提供强大的功能,又要避免不必要的复杂性。Skills在这个平衡上做出了有价值的尝试,值得我们这些AI产品从业者认真研究和借鉴。
Claude Skills系统发布引发AI行业新变革· 66 条信息
#Claude Skills
#AI能力扩展
#Anthropic
#AI原生应用
#技术生态
分享
评论 0
0
松果先森
2个月前
Grok官方给了一个玩Grok Imagine的技巧 这些关键词可以加到提示词里,可以让视频更影视化 更多的营造电影般的感觉: • 超逼真的电影镜头 • 多个动态摄像机角度 • 旋转轨道平移 • 慢速推拉特写 • 广角定场镜头 • 360度旋转 • 逼真的灯光 • 镜头光晕 • 景深 • 反思 • 超高细节 • 实时运动模糊 • HDR • 16K 电影画质 • 镜头之间无缝过渡 • IMAX 级电影摄影 • 深空氛围 • 细微的相机抖动 • 视差 • 体积照明 • 柔和的高光 最好去使用官方的英文关键词。
AI视频井喷:Midjourney领跑,多模态混战· 337 条信息
#Grok Imagine
#电影镜头
#影视化
#超逼真
#视觉效果
分享
评论 0
0
Fu Sheng
2个月前
认真看了下专业人士写的Sora 2提示词,得承认专业的提示词搓出来的视频水平确实到位,但是随着模型能力的进步,我们这种业余人士和专业的距离也会越来越小
Sora 2与Veo 3.1画质与叙事能力大比拼,谁更胜一筹?· 8 条信息
#Sora 2
#提示词
#视频生成
#AI模型
#技术进步
分享
评论 0
0
Cos(余弦)😶🌫️
2个月前
人类之间懒得互动(除了吵架),AI Bot 却一个比一个积极,且越来越拟人化,你骂它,它还不会有坏情绪。
OpenAI GPT-5发布引发用户不满,阿尔特曼回应质疑· 158 条信息
#人机交互
#AI Bot
#拟人化
#积极
#无情绪
分享
评论 0
0
Lex Tang
2个月前
vibe coding 了一个用来 vibe coding 新项目的脚手架😎
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#Vibe Coding
#新项目
#脚手架
#积极
分享
评论 0
0
Viking
2个月前
我还挺喜欢 Cursor 新出的那个 plan mode,有点像 Kiro,也是先给你出个文档,问你一些问题,确认以后就有一个具体的步骤的文档和一些 Todo 的 checklist,我用了快一周了,还是很满意的。 对于做新 feature 的话,效果不错,配合4.5 或者 gpt-5-high 是最好的。
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#Cursor
#Plan Mode
#kiro
#新feature
#gpt-5-high
分享
评论 0
0
howie.serious
2个月前
claude skills 的优势总结 近期准备每天整理一个 skill,看看一周后效果如何。
Claude Skills系统发布引发AI行业新变革· 66 条信息
#Claude
#技能提升
#效率
#个人项目
#积极
分享
评论 0
0
铁锤人
2个月前
你们用 Claude Skills 了吗? 感觉如何?
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#Claude
#skills
#体验
#评价
#讨论
分享
评论 0
0
Mr Panda
2个月前
真想学好编程, 就认认真真的把基础学好, 别整天vibe coding , 其实连个皮毛都学不到。
#AI编程:自学or科班?新旧码农之争· 156 条信息
#编程学习
#打好基础
#避免vibe coding
分享
评论 0
0
少濬
2个月前
Anthropic Skills vs. OpenAI AgentKit Skills 是为 Claude 定制的技能包,用户通过对话定义,Claude 会在需要时自动调用,无需手动编辑。 AgentKit 期望通过开发者构建和管理多步骤工作流,人工编排逻辑,成为企业 AI “自动化”的操作系统。 这背后的两条路线: 1️⃣ 用户使用视角出发,服务并强化模型即务 (MaaS) 2️⃣ 服务平台即服务 (PaaS) 的商业叙述和投资人逻辑 两个产品的未来还需要想象吗?为 OpenAI 的产品创新捏两把汗
Claude Skills系统发布引发AI行业新变革· 66 条信息
#Anthropic Skills
#OpenAI AgentKit
#Claude
#MaaS
#PaaS
分享
评论 0
0
铁锤人
2个月前
工具不只是执行你的想法,它们塑造你的思维方式 像 Codex Cloud 会鼓励你不要在agent工作时思考,而要花时间思考agent给出的最终结果 而像 Cursor 这样的 IDE 的产品 ,大多数 diff 都会在提交时就被接受。由于你正在接受代码(或不接受),你的思考时间相对较短。你几乎不需要思考就能提供正确的上下文,因为它已经在你的编辑器中了。这样做的代价是,你可能已经提前分解了问题。你需要花更多时间自己制定计划/方法 工具设计理念的不同决定了你的思维参与方式不同 认识到这一点十分重要,因为同样的思考模式久了,就会成为习惯 再次切换到别的工具就会产生认知摩擦,但你却浑然不知
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#工具
#思维方式
#认知摩擦
#习惯
#设计理念
分享
评论 0
0
nicekate
2个月前
喜欢 和菜头 最近文章的配图风格,参考样式让 Gemini 生成了几张
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 869 条信息
#和菜头
#文章配图
#Gemini
#图像生成
#风格参考
分享
评论 0
0
杨若晖 Ruohui Yang🤓
2个月前
还有这么好用的产品?
懒猫家族新成员亮相,AI算力舱引发热议!· 143 条信息
#好用
#产品
#疑问
分享
评论 0
0
AI进化论-花生
2个月前
前天分享了我用Claude Code写作的工作流,但实际上Claude Code已经不只是AI编程和AI写作的工具了,我完全是把它当成通用的agent去用,80%以上用到AI的任务都是通过Claude Code完成的了。 比如说,我昨天还让它帮我做了A股、美股等不同股票市场最近15年每天指数变化数据的收集,还做了一些策略的回测分析;晚上又拿它来给我下载B站博主的视频字幕文件,帮我学习和借鉴他们的内容创作结构。 然后,当你期望cc帮你完成的任务越来越多,你在不同的任务上有不同的要求,又频繁需要切换的时候。 这里涉及到一个挺重要的问题是:你需要给cc规则,但...你又不能一次性给太多规则,否则影响任务表现、影响指令遵从情况,上下文也很容易爆掉。 所以,我这里分享一个我的经验,就是建一个路由机制,在你和cc对话的文件夹根目录中用去写这套任务机制,同时,又在每个子文件的目录下分别写上对应任务的,并且要在平时用的过程中,频繁地让cc去更新规则。 这种情况下,既可以让你每次在固定的路径下打开cc,同时又解决各种潜在问题,我自己的感受是比用subagent还好用,也有点像anthropic昨天刚提出的skills的概念,但这种方式的自主性和可调节性会更强一些。
Claude Skills系统发布引发AI行业新变革· 66 条信息
#Claude Code
#AI Agent
#股票市场数据
#B站视频字幕
#路由机制
分享
评论 0
0
向阳乔木
2个月前
veo3.1 在剧情叙事理解、画面连贯性上完败 sora2,至少这个case是这样
Sora 2与Veo 3.1画质与叙事能力大比拼,谁更胜一筹?· 8 条信息
#Veo3.1
#Sora2
#剧情叙事理解
#画面连贯性
#技术对比
分享
评论 0
0
howie.serious
2个月前
一图胜千言: 请用一张图总结claude刚发布的agent skills功能👇
Claude Skills系统发布引发AI行业新变革· 66 条信息
#Claude
#Agent Skills
#AI
#新功能
#总结
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
2个月前
𝕀Rℙ² 交互范式编程的首选:anthropics/skills 如何系统化地设计输⼊,以最⼤化ICL效率? > 这不是”写更好的提示词”(技巧层⾯),⽽是重新定义⼈机交互的本体论(范式层⾯)
#多智能体之争:Anthropic生态VS单智能体· 81 条信息
#交互范式编程
#ICL效率
#人机交互
#本体论
#anthropics/skills
分享
评论 0
0
铁锤人
2个月前
你仍然需要思考 随着编码智能体(coding agents)的能力越来越强、运行时间越来越长,这并不意味着人类“思考”的工作就被取代了。总得有人来负责指挥这些工作——设定目标、选择约束条件,并对输出结果作出判断。 大家在抽象层面上似乎都认可这一点,但几乎没有人真正讨论过一个事实:产品形态的不同,实际上会从根本上改变“写代码”时所需的思考方式。 💭 不同产品形态对“思考预算”的影响 我认为,不同编码智能体之间看似细微的 UX(用户体验)差异,实际上对用户“思考预算”的分配方式有着巨大的影响。 远程型产品(如 Codex Cloud,而非 CLI): 这种产品鼓励你不要在智能体工作时花太多精力思考,而是更多地在最后拿到结果后再思考。 我们甚至刻意不让用户看到智能体调用终端命令的过程,因为模型的工作方式和人类有本质区别。 交互式产品(如 Claude Code 或 Codex CLI): 在这种产品里,你会花更多时间去思考规范和智能体采取的高层方案,因为你可以在终端中“跟随”它的思路。 不过,你需要在其他地方(如编辑器或 GitHub)查看代码差异,因此工作流程更多是在跟进智能体的计划并验证执行过程。 IDE 集成型产品(如 Cursor): 你会快速地接受或拒绝智能体给出的代码改动。 因为上下文已经在编辑器中,所以你无需花太多心思去提供上下文信息,但这意味着你可能需要提前花时间把问题拆解好,在最开始就想清楚计划和方案。 🧠 “思考预算”的四个主要环节 所有这些产品都需要在以下四个环节之间重新分配“主动思考”的时间: 提供正确的上下文 制定计划 实现代码 验证和审查 就目前 LLM 的能力而言,我的判断是: 👉 实现(3) > 验证(4) > 规划(2) > 提供上下文(1) 也就是说,“提供上下文”仍然是人类价值最大的地方。在我们拥有更好的组织内搜索工具、用户信息提取工具、全局上下文理解能力之前,这一点都不会改变。 另一方面,LLM 在接收清晰的计划并实现它时表现非常出色。它们能很好地处理竞态条件、错误处理以及复杂的技术细节。 🔍 不同问题 & 不同思考方式 如果你接受“思考预算”这个概念,就不难理解为什么工程师在使用不同工具时的体验差异会如此巨大: 有些问题只需要一个清晰的规范——你已经完全知道实现的样子。 有些问题需要通过写代码来“思考”问题本身,然后再进行重构。 有些工程师更喜欢先看一版初稿再进行审查,而不是从零开始写。 不论你偏好哪种方式,不同的产品体验都要求你用不同的方式来思考。我认为不太可能出现一种“单一工作流程”就能满足所有用户的需求。 你依然需要思考……但最好的产品,会让用户自己选择他们想要“如何思考”。
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#编码智能体
#思考预算
#产品形态
#用户体验
#代码实现
分享
评论 0
0
向阳乔木
2个月前
veo3.1 画质更好更遵循提示词,sora2更有故事性?
Sora 2与Veo 3.1画质与叙事能力大比拼,谁更胜一筹?· 8 条信息
#Veo3.1
#Sora2
#画质
#故事性
#AI
分享
评论 0
0
上一页
1
...
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
...
248
下一页
AI 实时热榜 (24小时)
智能算法加权排行
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞