这两天一直在玩 OpenClaw, 也顺便抽空看了下源码, 毕竟是明星开源项目了. 发现 openclaw 代码本身的逻辑不难理解, 就是给 LLM 模型提供一下当前系统命令行可以用的几个工具, 告诉模型用户要做啥, 一个 while 循环不断问 LLM 下一步做什么, 直到模型返回纯文本, 没有本地工具调用了就返回给用户, 经典的"自动推理和工具使用(ART)"技术的落地实现. 不是那种看完令人生畏的项目, 也有瑕疵, 比如 built-in prompt AGENT. md 里面只用 markdown, 类似<instructions>, <constraints> 这种符合 prompt engineering 的 tags 都没有. 但是想法就是很好, 作者 vibe 了 40+ 个项目, 中了一个就成了, 具现化了 AI 时代最重要的是"灵感". 现在这个时代就是"使用数据"的方法变得越来越廉价, 越来越简单, 重要的只有数据和怎么使用它的"灵感", 在软件领域这部分叫业务代码, middleware 等东西, 在其他领域叫别的东西: 数据 -> 清洗比较, 可视化-> 研报 -> 投资决策 数据 -> 探索 -> 灵感 -> 论文 数据 -> 清洗, 统计, 分析-> 决策 -> 行政指令 数据 -> ? 箭头右边使用数据的部分, 只要是虚拟的, 跑 CPU, GPU 上的软件, 网页, 文件, 报告, 音频, 视频等东西, 其实都能被 AI 取代, 毕竟本身这些东西就是程序员敲出来的, 而现在的 coding agent 已经证明它们能敲得比一般的程序员还快, 还好, 更别说本身底层模型还在进步. AI 先是结合"检索增强生成(RAG)" 技术让信息的获取变得异常简单, 只要你会问问题, 就能找到合适的最新的答案, 然后又用自动推理和工具使用(ART) 技术搞出了coding agent, 给程序员上了个 buff, 让代码输出效率飞跃, 然后全世界无数的码农们手里拿着锤子, 看啥都是钉子要敲两下, 然后就是其他行业积累的虚拟世界的专业壁垒被敲得粉碎. 这个循环本质是: 生产者效率提升 -> 更快的生产"生产工具" -> 效率指数提升, 也算是在现实里让我们亲身体验了一下"三体"里面的"技术爆炸"概念了.
Nullable
1个月前
12/29 mark 一下中国今年第二次围台演习, 这次比上次更 aggressive 的地方是不管海上还是空中, 距离比之前更近一些. 触发这次行动的官方说法是美国新的对台军售, 但最近还有一个比较重要的事件是 12/20 委内瑞拉给中国运油的油船被美国扣了. 委内瑞拉这边的情况不太正常, 美军行动太拖沓了, 最近可以作为对比的例子是今年对伊朗核设施的轰炸, 白宫放消息到开始行动也就一周时间左右, 而且伊朗还在中东, 比委远很多, 实力比委强很多. 委这边的时间线: 10/4 以及之前, 空军海军的调兵信息已经不少, 打船已经开始一段时间. 我从十月初开始关注, 记得好像是找黄金相关消息的时候注意到, 那时美委冲突并不起眼, 市场的注意力还在OAI搞出来的左脚踩右脚模式和中美冲突上: 11/11 福特航母从欧洲开到了加勒比海. 11/13 航母到了马上宣布开始"南方长矛"行动, 我以为美军感恩节都不过了. 11/20 划出禁飞区 11/29 Hegseth 因为 9 月打船杀死幸存者被指控 12/16 封锁海上通道 12/20 扣押"世纪号"中国油轮 这个时间线里面台湾周边事件: 11/7 高发表"台湾有事"言论 11/13 - 20 外交部强烈反应, 要求高收回言论, 事件快速升级, 中国海警船进入钓鱼岛巡航, 黄海实弹演习, 暂停日本海鲜进口等等措施连续出台. 12/6 中国战机火控锁日本战机 12/15 中国开始制裁日本官员个人 12/29 第二次围台军演. 感觉到现在两边都是只差临门一脚. 现在有卫星, 有网络, 大规模的军队集结不可能隐藏, 能有以前那种"突袭"效果的只能是突然的"演习"转实战, 俄罗斯22年示范过一次. 个人感觉只要美军真的开始袭击委, 台湾也可能会"有事". COVID后感觉世界被按下了加速键, 历史事件都看得麻木了, 这就是历史转折点时期的感觉么?
Nullable
2个月前
圣诞聚会, 偶然从朋友听到的关于某个大厂的AI进展消息. 1. 引入 AI 后, AI 搜索的 per-query cost 比起以前上升了 10倍以上. 我追问为什么财报数据为什么没体现出来这方面的影响, 朋友也不知道, 他不太关注项目之外的事情 (follower里面有内部人士能给点 insight 吗? 为什么?). 我自己的猜测是因为目前 ai search traffic 还不太大, 这部分成本的上升还未大到明显影响财报程度, 而目前 AI model 只有订阅方式变现, 无其他变现方式, 大厂主业的客户还暂时没其他选择, 所以只要不是宏观经济影响到客户的 budget, 大厂收入还不会开始锐减. Anyway, 如果是这样, 在ai search 继续普及和降低 token cost 接近普通 search 之间存在一个时间差, (不用一样, 2倍, 3倍成本差可以接受, 但目前10倍以上的成本差距感觉不可持续), 这个时间窗口内该大厂会持续掉血, 而且需要在掉血状态防守流量入口. 2. 大厂的明星产品 app M 目前有一个明显缺陷 -- 当所有 ai chat 都能在回复里面给某个句子添加 citation, 给整个回复添加 sources 的时候, M 到现在都没有该功能, 这显然不是技术问题, 现在我才知道为什么. 如果要给 AI 回复添加 citations, 需要该厂的另一个产品 S 配合给数据, 但因为该厂内部 M 的 owner 和 S 的owner 分属不同 VP, 所以 M 无法从 S 轻易获取这种数据实现这么一个简单的通用功能, S 自己也推出了一个类似 M 的 app, 它里面就有类似的 citation 功能, "百万漕工衣食所系"问题, 依旧是朴实无华的政治斗争结果. 3. 如果AI模型继续进展, 该公司的 S 产品里面很多部门其实都可以砍掉, 连我朋友这个大头兵都能看到的问题, 估计后面该大厂还有大幅裁员. S 产品底下的所有 teams 都在疯狂内卷, 尝试在下一代的产品领域占地盘, 他们内部流行的说法是如果组内的 idea 无法在4个月内落地成 GA 版本的功能, 模型的能力就有概率追上来自己实现这个功能. 该大厂内部卷的程度已经和其他卷厂没什么区别了. 感觉这些信息可以影响到我对大厂的仓位分配, 我对它的乐观程度减少了部分.