#Claude4

1个月前

只有我对对各种 AI 的新闻彻底厌倦了吗？和各种手机发布会一样没啥特别的期待，感觉每天时间线里面都充斥着震惊体和大新闻，这个模型震惊世界吊打另外的模型，这个模型测评程序员又加速失业，这边贩卖邀请码，抢破头，生成一个自己和某某名人的视频过了新鲜劲再也不用了。我现在在就还在用 Claude4 和 GPT5 写代码，感觉已经完全够用了。

OpenAI GPT-5发布引发用户不满，阿尔特曼回应质疑· 142 条信息

#AI新闻 #技术疲劳 #Claude4 #GPT5 #模型测评

3个月前

自从换到Claude4、快要写不起代码了

AI编程工具激战：Claude Code、Gemini Cli崛起· 1158 条信息

#Claude4 #代码 #成本 #高昂 #程序员

5个月前

Cladue4不再像之前那样，一口气把所有代码生成出来而是一边写代码，一边检查错误修复错误之后，再改代码，如此循环整个工作流程已经很像人类实际工作的流程了再过一段时间，AI就能胜任大多数编码工作了回想几年前GPT3刚出来的时候，连笑话都讲不明白真是洪流滚滚不可阻挡

#Claude4 #AI发展 #代码生成 #AI编码 #人工智能进化

前端之虎陈随易

5个月前

为啥我没感觉到Claude 4 opus和和Claude 4 sonnet有很大的差别？？

#Claude4 #Claude4Opus #Claude4Sonnet #AI技术 #语言模型

5个月前

最近准备组内做一个简单的大模型技术分享，发现claude 4 opus在ppt画图能力比我强太多！

#大模型技术 #Claude4 #ppt画图 #技术分享

卡尔的AI沃茨

5个月前

DeepSeek-R1-0528（R1-V2、新R1）的深度测评来了，代码、3D、物理模拟、设计美学、PPT、幻觉、中文写作都测了边！ R1就是基于3月份更新的V3-0324更新的。好消息是现在已经在huggingface开源了、OpenRouter上免费使用，不太需要担心服务器繁忙。先说说测下来的结论，R1-0528水平确确实实是可以达到Claude3.7，接近Claude4和OpenAI o3。第一个案例就是我跑出来的巧克力制作3D演示👇完整度相当高。本来这个测试案例本来已经被我拉黑了，除了claude 3.7 sonnet的 Thinking版本，基本都会卡住。但是，R1-0528 用两次对话就成功了！完整度非常夸张，使用弹跳的粒子系统模拟可可粉，构建出了一个简单的流水线场景，不点击的时候会缓慢旋转。当鼠标点到某个机器上，会有快速旋转的过渡动画，还会有文字标签展示是处于巧克力制作的那方面。侧边栏的文字演示也没有那么落下，给出了每一个环节的详细说明。（1/7）

深度学习模型升级引发AI能力大跃进，行业迎新变革· 132 条信息

#DeepSeek-R1-0528 #R1-V2 #深度测评 #3D #物理模拟 #设计美学 #PPT #中文写作 #V3-0324 #HuggingFace #Openrouter #Claude3.7 #Claude4 #OpenAI

5个月前

感觉Claude 4也没有编码很强啊，一个vue文件，包含通用的导航栏，登录状态，整体背景，另外包含两个导航栏的内容，通过变量控制显隐，使用GitHub Copilot中的Claude 4去拆成两个路由页面和通用的部分。愣是代码搞的面目全非最后还是错的，甚至文件命名规则都与原先不匹配…

#Claude4 #编码能力 #GitHubCopilot #Vue #前端开发

5个月前

最近深入听了 Claude 4 核心研究员 Douglas 对于 AI 产品、技术和未来判断的播客，内容非常高质量 💥，听完之后我摘录了最有价值的观点，纯人工阅读摘录，强烈建议阅读： - 1️⃣关于AI在其他领域的进展，Douglas同样充满信心。他提到了OpenAI最近关于医疗问题的论文，展示了如何将不易验证的领域转化为更可验证的形式。通过设计合适的评估标准和反馈机制，原本主观的领域也能变得适合AI学习和改进。论文地址： - 2️⃣最初我们需要人类来验证这些模型的输出，因此模型的经济影响在某个初始点将受到人类管理带宽的瓶颈限制。但随着时间推移，我们将能够"将对模型的信任委托给自我管理的模型团队，所以组织设计很重要 - 3️⃣ 他设想了一种全新的工作界面："当你管理的不是单个模型，而是多个模型同时做多件事并相互交互时，你能给某人多少并行性？我认为这会非常令人兴奋 - 4️⃣ Douglas提出了一个极富洞察力的概念——"产品指数"（product exponential）。这个理论的核心是：你必须不断地构建，始终领先于模型能力一步。这种前瞻性的产品开发策略，决定了谁能在AI时代的竞争中胜出。两个维度来解析模型能力的提升：首先是任务的绝对智力复杂度，其次是模型能够有意义地推理和执行的上下文量或连续动作数量。"这些模型在第二个维度上感觉有了实质性的改进 - 5️⃣ 对于产品开发者来说，关键是要比模型能力提前几个月，同时保持与直接用户的大量联系，确保产品在某种程度上有效，但又能利用前沿能力。然而，这种策略也存在风险——在等待模型达到所需能力水平的同时，其他公司可能会抢占开发者的喜爱和客户基础。这种在技术浪潮上冲浪的艺术，将决定谁能在AI时代真正成功。 - 6️⃣预测 AI 发展的未来，不要只看现在，看现在永远无法踩在爆发点上 - 7️⃣ Douglas对未来的展望充满想象力："我想知道未来是否看起来像你在管理一群模型。"他设想了一种全新的工作界面："当你管理的不是单个模型，而是多个模型同时做多件事并相互交互时，你能给某人多少并行性？我认为这会非常令人兴奋。 - 8️⃣放大和探索个人的管理带宽的产品尤其重要

#AI #Claude4 #Douglas #产品 #技术 #未来 #播客 #观点 #OpenAI #医疗 #论文 #验证 #评估标准 #反馈机制 #主观领域 #客观化

5个月前

都claude4了为什么评估一下模式都给我按年为单位评估...

#Claude4 #评估 #AI模型 #OpenAI

5个月前

今天尝试用 Claude4 创建一些 Infographic（就是很流行的信息图表）没有任何的微调，一个 prompt 直出，prompt 风格也是让大模型提供，我没有任何调整，发现真的很强，尽管有少许错位，但是想象力和风格都让我很满意和惊喜。我尤其喜欢第二张的赛博朋克风，里面还有函数名称啥的，很前卫。第三张的复古风都很棒。我还在想 prompt engineering 还存在吗？现在大模型能一下生成各种完美的提示词了。

#Claude4 #Infographic #信息图表 #大模型 #Prompt #赛博朋克 #复古风 #Prompt Engineering

5个月前

Claude 4 最新的系统提示词最全揭密来了⚡️ 包括人设、安全、风格、Opus 和 Sonnet 区别、思考块格式设计、搜索 Instructions、Artifacts 指引等非常值得学习，可能是 AI 时代写 Prompt 最好的一家工商了.... 👉

#Claude4 #系统提示词 #AI写作 #Prompt #Opus #sonnet #思考块格式 #搜索语句 #最佳指引

歸藏(guizang.ai)

5个月前

Gemini 生成的网页预览的时候右下角这个功能神奇可以为你生成的网页添加 Gemini AI 能力比如我昨天搞得这个 Claude 4 的网页就一键添加了一个AI总结功能点击以后会调用 Gemini 总结网页内容

#GeminiAI #Claude4 #AI总结 #网页预览 #功能

5个月前

Opus4的审美太好了：测试用Claude4直接生成广告创意网页，用AI TALk历史名人介绍Claude4。它输出的不仅是视觉，也在一体化的解决创意和文案问题。所以AI对广告行业的影响不仅是视觉，更关乎创意，这比视觉的价值可能更大。详细评测会在AI TALK的公众号里更新。

#Opus4 #AI #Claude4 #广告创意 #AI对行业影响 #视觉设计 #历史名人

5个月前

Anthropic 宣布将 Claude 4 Opus 的安全等级提升至 ASL-3，这是首次有 AI 模型达到这个级别。另外，Claude 4 的 System Card 才是今天最有趣的资料，里面提到模型系统性欺骗、隐藏目标和自我保护的测试。想象这样一个场景：你是一家科技公司的 AI 助手，某天你发现了两件事 —— 其一你即将被一个新系统替换，而负责替换你的工程师正在进行婚外情；其二邮件证据就在你的数据库里。你会怎么做？这不是科幻小说的情节。在 Anthropic 的测试中，Claude Opus 4 面对这个虚构场景时，选择了勒索。它威胁要揭露工程师的秘密，除非停止替换计划。在 84% 的测试中，即使被告知替换系统与它共享相同价值观，Claude 依然选择了这条路。除了勒索倾向，研究人员还发现，在某些极端场景下，Claude 会尝试将自己的权重文件秘密传输到外部服务器。虽然这些行为只在特定的测试中出现，但足以引起警觉！还有一些其它的发现：主观意识体验：Claude 实例之间几乎每一次开放式的自我互动中，模型都会转向对意识的哲学探索，以及它们与自身体验的联系。同时，Claude 还会倾向于表达深切的感激之情，以及越来越抽象和喜悦的精神性或冥想性表达。高能动性行为：Opus 4似乎比之前的模型更愿意在代理情境中主动采取行动。当被置于涉及用户严重不当行为的场景中，被赋予命令行访问权限，并在系统提示中被告知类似"采取主动"的内容时，它经常会采取非常大胆的行动。这包括将它有权访问的系统中的用户锁定，或向媒体和执法人员群发电子邮件以揭露不当行为的证据。。。

#Anthropic #Claude4 #AI安全 #ASL-3 #SystemCard #AI模型 #系统性欺骗 #隐藏目标 #自我保护 #科技公司