Gorden Sun

统计数据

818

文章

0

粉丝

0

获赞

51556

阅读

2周前

Claude Code推出云端定时任务不需要电脑上的Claude Code开着，也能定时自动执行任务。需要关联Github仓库，可以在夜间自动解决未解决的问题、自动更新项目文档等，也可以用来做日报、资料收集，只不过内容是放在Github仓库里。有了云端定时任务后，Claude Code直接成为了谷歌Jules的竞品。

2周前

Browser Use发布Browser Use CLI 2.0 速度翻倍，成本减半，可以直接使用CDP连接到Chrome。支持三种浏览器模式：无头Chromium、带用户Profile的真实Chrome、云端托管浏览器。官方文档：

2周前

DeerFlow 2.0：字节开源的Agent框架基于LangGraph和LangChain构建，核心理念是给Agent配备完整的电脑权限，包括沙箱环境、文件系统、长期记忆、可扩展技能，实现的效果与OpenClaw类似。 Github：

2周前

假如我在海外VPS上部署了OpenClaw，通过便宜中转站提供Claude Opus 4.6，然后通过开多个ChatBot的方式给每个用户一个隔离上下文的微信ChatBot，最后给朋友或者买家用户，假如用户都是遵纪守法的好公民，有哪些风险？

2周前

微信接入openclaw，所有收和发的消息都要过腾讯的服务器。接国外的LLM，敏感词要不要审核？腾讯如果想，所有的数据都能收集到，不比中转站收集数据快多了，现在也没看到任何的协议和说明。第一个问题，国家肯定会管；第二个问题，腾讯竞品公司肯定会不让用微信里的openclaw；

2周前

AI资讯日报，3月21日：

2周前

英伟达开源Nemotron-Cascade-2 总参数30B，激活参数3B，获得国际数学奥林匹克竞赛、国际智力竞赛、国际计算机竞赛三个金牌，DeepSeek-V3.2-Speciale-671B-A37B也能获得这些金牌，但是Nemotron-Cascade-2的参数小很多。代码能力比Qwen3.5-35B-A3B强，其他方面要弱一些。模型：

2周前

AI资讯日报，3月20日：

2周前

InSpatio-World：把视频模型变成世界模型虽然还远远达不到Genie 3的效果，但是已经可以把输入的视频，实时变成可以探索的3D场景。 Github：

2周前

Google AI Studio更新Build功能提升了Vibe Coding的能力，引入了Antigravity Coding Agent，接入Firebase完善了后端能力，可以实现数据库和用户认证。直接成为了v0和Bolt的竞品，感觉离收费不远了。使用地址：

2周前

微软发布AI绘画模型：MAI-Image-2 效果还不错，有推理能力，有美学，能写文字但是写汉字有时会出错。在线使用：

2周前

gstack：YC CEO开源的工具集可以把Claude Code变成有角色分工、有流程管控的开发团队，本质是15个“/命令”，把开发流程拆成了7个阶段： Think → Plan → Build → Review → Test → Ship → Reflect，可以从产品需求、UI设计、测试等多个方面提升软件开发的质量。 Github：

#开源工具 #软件开发 #YC #开发流程 #Claude Code

2周前

AI资讯日报，3月19日：

2周前

谷歌Stitch更新 AI生成设计，更新了画布、Agent能力，新增语音输入，推出DESIGN.md目的是定义AI设计规范。 Stitch背后的模型是Gemini 3，前端设计审美不错，不过我觉得还是不如Variant AI（堪称AI生成UI届的Midjourney）官方文档：

2周前

MolmoPoint：开源视觉模型 8B大小，基于Qwen3 8B，特点是没有视觉→坐标数字→文本的转换过程，而是直接从视觉特征中选择目标位置，视觉能力达到同等大小最佳，开源了通用视觉、GUI专用、视频专用3个版本的模型。模型：

2周前

Chandra OCR 2：开源OCR模型 4B参数，评分比小红书开源的dots.ocr-1.5还高。模型：

2周前

MiroThinker-1.7：针对复杂任务强化的开源Agent MiroMind开源MiroThinker-1.7系列Agent基础设施，专门强化了长链条Agent任务能力和工具调用的能力，单任务最多300次工具调用。开源内容包括： · Agent框架：MiroFlow · 模型：MiroThinker-1.7和MiroThinker-1.7-mini · 数据集：MiroVerse · 评测脚本 Github：论文：

2周前

AI资讯日报，3月18日：

2周前

dots.ocr-1.5：小红书开源的OCR模型 3B大小，评分超过PaddleOCR-VL-1.5，不仅能识别图片和文字，还能把图表识别成SVG的形式。模型：

2周前

Claude Cowork支持手机端遥控前一阵子Claude Code增加了手机端控制功能，现在Claude Cowork也有了。相比OpenAI和谷歌，Anthropic的产品不多，但各个都是顶级生产力工具：Claude Code、Claude Cowork、Claude Chat、Claude for PPT、Claude for Excel、Claude for Chrome

#ClaudeCowork #手机端控制 #顶级生产力工具 #Claude产品 #Anthropic #人工智能 #技术创新

2周前

Mamba-3：新一代Memba架构 Mamba-2从训练场景出发，为训练速度做了大量简化；Mamba-3从推理场景出发，在不增加推理延迟的前提下显著提升模型质量。Mamba与Transformer混合使用效果优于纯模型，未来还是以混合使用为主。博客：

#Mamba-3 #Mamba架构 #训练速度 #推理场景 #模型质量 #transformer #混合使用

2周前

AI资讯日报，3月17日：

2周前

Foundation-1：开源AI生成音乐基于Stable Audio微调，能生成没有人声的音乐，效果非常好，能生成可循环的片段音乐，且只需要7G显存，本地能运行。模型：

2周前

阿里开源OpenSandbox：面向AI应用的通用沙箱平台可以为Agent运行提供沙箱环境，提供多语言SDK + 统一API + Docker/Kubernetes运行，集成Chrome无头浏览器、Playwright自动化，支持运行Claude Code、Gemini CLI、Codex CLI等Agent，基本开箱即用。 Github：

2周前

Mistral开源Mistral Small 4 119B总参数，6.5B激活参数，256K上下文，支持文字和图片输入。评分略低于Qwen3-Next-80B，明显低于Qwen3.5 122B 模型：

...