#博客

2个月前
改变AI认知的一篇文章 我敢说这是今年最值得每个人读的AI blog,让我彻底震撼! OpenAI researcher 姚顺雨的blog,这里有个趣事,贵清有两个yaoshunyu,一个在Anthropic、一个在OpenAI。 文章非常好,像是某个大佬深夜写的真心话,可惜最近一直比较忙,没时间细写。网上也有不少写的了,我们就写一个普通人能看懂的版本吧。 不再刷榜!大模型的下一个10年:真正创造有用的产品、产生实际价值,催生万亿级别的公司! 1、上半场总结:卷模型、创新算法、刷benchmark - 历史书中AI发展的里程碑事件,deepblue、AlphaGo、GPT-4和o系列,背后都是算法上的突破:搜索、深度强化学习(deep RL)、scaling和reasoning。 - 上半场的游戏规则很简单: - 谁搞出来的新方法、新模型能在benchmark上刷出新高分,谁就厉害。 - benchmark主要是跑分用的,出不了啥风头。文章举了个例子,ImageNet那么重要的benchmark,引用量还不到AlexNet的三分之一。(不过在科研中还是经常有人看不起 benchmark 的工作,认为只有工作量没有创新性... - 创建更困难的基准测试,然后继续循环 - 也很合理,从零搞出反向传播、CNN、Transformer,需要多强的洞察力、工程能力?相比之下,定义个测试任务好像就简单多了,很多时候就是把人已经在干的事儿(比如翻译、认图、下棋)搬过来,变成AI的考题,技术含量感觉没那么高。 2、转折点:炼丹术突破了,强化学习(RL)终于能打了!可以泛化了 强化学习有三个关键组件:算法、环境(environment)和先验知识(priors)。之前做RL的人,主要关注算法,对环境和先验知识的关注比较少。但是在 deep RL时代,很明显环境也非常重要:算法性能往往高度依赖于开发和测试环境。 海量语言预训练(Language Pre-training):OpenAI最初的计划是先构建通用环境(gym),想把互联网、电脑操作都变成RL环境,然后用牛逼算法去解,数字AGI就成了。听着挺美,但没完全搞定,尤其是在复杂任务(比如上网、操作电脑)上,泛化还是很差。直到GPT-2/3出来,大家才意识到,想把这个RL炼丹完成,缺的是强大的先验知识(通过与RL完全无关的方式获得)!靠预训练把互联网上的常识、语言知识塞给模型,然后再微调(SFT/RL),才能搞出WebGPT、ChatGPT这种能打的模型。 后来就开始进行Scale阶段了,数据和算力越来越大,这个大家都懂。 推理与行动(Reasoning and Acting):这是姚顺雨特别强调的一点,也是我们看懂模型目前阶段的关键。 要理解一个故事:他当年用GPT-2搞文本游戏,发现模型虽然能学,但需要海量步骤,而且换个游戏就不行了。他的“顿悟”是:人不仅会执行具体动作(开箱子、用剑砍怪),还会思考(这地儿危险,我得找个武器,武器可能在锁着的箱子里,箱子在柜子里………)。这种“思考”或“reasoning”,虽然不直接改变外部世界,但它是一个极其重要的“动作”,能利用预训练模型里的先验知识来泛化。虽然理论上给增加无限的“思考”选项会让决策变得困难,但实际上,因为预训练模型“见过”各种情况下的思考模式,这种“思考”反而能帮助模型更好地选择真正有效的动作。作者的原话大概意思是:“语言通过在agent中进行reasoning来实现泛化”。 有了强大的语言先验知识 + 把reasoning也当作一种action加入环境 + 足够的规模——作者有点讽刺地说,反倒是RL算法本身,可能成了最不重要的部分。哈哈哈哈,这也是我们一直说的那句:RL,大道至简。 这跟以前RL研究的重心完全反过来了,真是三十年河东,三十年河西。 3、下半场:别光卷模型了,开始卷“问题定义”和“评估”吧 这段其实也很简单,我们也一直提了好久了,大家都刷榜,是因为对模型能力缺乏有效的评估手段。 我们一直的观点是,evaluation是大模型最重要的一部分(可能没有之一),正如那句老话:"if you can't measure it,you can't improve it"。 姚顺雨大神也说了,下半场靠新方法/模型刷分的游戏就快玩不下去了,为啥? - 一来,这套“秘方”越来越标准化、工业化了。上述范式能很好的scale和泛化时,你针对特定任务的新方法可能改进5%,而下一个o系列模型在不明确针对这个任务的情况下改进30%。 - 二来,就算你搞出更难的benchmark,用不了多久也会被这套“秘方”给平推了。 那下半场该做什么呢?姚顺雨觉得我们应该从根本上重新思考评估。这意味着不仅是创建新的、更难的基准测试,而是要开始问“我们到底应该让AI干什么?怎么衡量才算真正的进步?” 这要求思维方式的转变,得更像个产品经理了(算法研究员和产品经理殊途同归了?:P) 他举了个例子,AI在各种考试(SAT、IMO、IOI)和游戏(棋类)上都超神了,但感觉现实世界好像没因此发生翻天覆地的变化,很多普通人完全没关注 AI 的发展而且也没受到影响?因为我们的评估方式跟真实世界脱节了。 因此下半场的真正范式是: - 我们开发新的评估设置或任务,追求现实世界的效用 - 我们用现有算法来解决这些新问题(努力提高效用而不是刷榜)
我全是被动收入。 我更愿意称之为“自动化收入” 以前写过一篇blog,不过推特点外链的率太低。 我贴过来供大家参考: ------------------- 我致力于自动化收入远在国内的时候就开始了,因为本身有编程序的爱好。这样我就依时间次序介绍一下我怎么赚取自动化收入给大家参考。 所谓自动化收入不是完全躺平,而是setup and forget的概念。必须要先做一个东西,然后通过这个东西源源不断的赚取收入,原则如下: 1⃣如果这个项目睡觉、旅行的时候赚不到钱的话,就不要开始。 2⃣尽量保持此项目的普适性、长期性、setup and forget的特点 3⃣尽可能保持项目独立,不要依附其他因素,达到无立足境,是方干净 第一个原则是最基本的,二三两个原则是我后来加的,刚开始考虑不到那么多。 依据第一个原则,在国内的时候(2012年前)我除了本职工作,就搞了以下项目: 1⃣PC软件 Shareware 付费共享软件 Freeware 内嵌工具条安装程序 2⃣英文电子书 Clickbank电子书代理 Resell Right 转售权书籍自营 此两项目当时在国内可带来2000美金每月左右收入,所以以我在国内中产阶级又没有吃到国内房地产红利的状态下,也敢举家创业移民新西兰。 可惜这两个项目都不符合二三原则,2012年刚出国的时候正好下载pc软件热度退烧,加之电子书的项目要求英文水平要比较地道,本来每月2000多美金的自动收入突然暴跌到无。 来这买个服装店办移民,再买个自住房,钱包就基本干瘪了。 周一到周六开店,每天中午吃面包抹果酱,持续了半年。这个小城市20万人口不到,零售店还很难做。最有印象的是花了2000多纽币在本地最大的报纸打了4个礼拜广告,来了4个人。简直是一拳打在空气里。 来这移民办的不顺利,移民第一年因律师不太靠谱续签被拒,移民局给了十天时间让我们卷铺盖回国,熬了两夜重新写了商业计划书第二次办理创业移民,总算安顿下来。 不过这些经历都是财富。让我更好理解《遥远的救世主》的文化属性,必须自己有强者文化,靠自己,在资本主义国家才能更好的生活。 服装店不是自动化收入,因为需要投入时间、精力,而且一点点收入就能消磨你的志气。 2016年拿到绿卡后,可以购买当地商业房产了,才又出现了自动化收入的转机。 我这里的经验全是个体户的经验,不是大公司的做法,大公司老板是借人工来实现他们的自动化收入,而我一向认为人心是最难把握的,故此本人的自动化项目基本以程序为主。 以下这几年的项目,和要点供参考: 1⃣购买商业房产 要自己看懂报表,可以保证购买价格的合适性 要自己看懂租约,找到对自己有利和不利的条款。一般而言,在资本主义社会,对房东的条款都是比较有利的,因为这些法律是资本家们讨论出来的。 租金收入要高于贷款较多,这样才叫自动化收入(income),而不仅仅是capital。capital是普通住房,华人喜欢加大贷款买,但租金收入一般低于或仅仅持平还贷,无法起到自动化收入的降低心理压力的效果。一旦加息等情况出现比较被动。 2⃣网站广告收入 网站种类不限,根据水平都可以做,但要有基本的建站知识、广告管理知识、前台设计知识。我相当于自己做了三份Job,后台、前台、广告管理,所以网站能赚到3个人的钱也是正常的。 广告以Adsense开始,进而了解Header Bidding、Prebid 这个我没有做,因为懒,就是Amazon等公司的产品推介,考虑到读者不一定有我那样的编程水平和热情,就说一下这个,技术瓶颈比较小,整一个Wordpress就可以做起来,可以从Reddit的juststart群组 学习相关知识。 要坚持setup and forget的特点,不然会越做越累,比如Youtube视频广告收入,如果你不更新视频,排名很快会下滑。 尽量做自己的网站,而不要仅仅在Medium、hubpages等站放内容,要知道你的内容就是你的产品,全部放在其他网站上,实际上是给他们提供了价值,而且这些中型网站并不太稳定,google的排名算法一变,可能一个中型网站就没啥流量了。比如以前大名鼎鼎的Digg,现在流量甚至还不如我的网站,情何以堪。 3⃣半自动化外汇交易,可以详见 《交易入道》大纲 这个算我的知识范围里的终极自动化收入了。前两者商业房产受经济周期影响和Google等大公司算法影响,并不算真正稳定的收入源 真正稳定的收入源是知识和所悟的道。金融交易本质上是一样的。可说即使大家移民到火星,又开一个新的交易所,操作原理也是一样的。 外汇交易多空均可,不受经济周期影响。 因有Prop Firms公司存在,自有资金要求较小,真正体现了“知识就是力量”,而不需要知识+金钱才是力量。 投机像山岳一样古老,通过交易领会的术法道可以达到无立足境,是方干净,从而实现天下无敌。 本人的自动化收入经验就是如此,大家根据个人生活履历不同、喜好偏向不同,可以根据楼上三原则发展出自己的自动化收入,下面再给两点提醒: 1⃣要虚心,能刷到这的应该都算比较虚心了,至少到了中士的程度。老子说上士闻道,勤而行之;中士闻道,若存若亡;下士闻道,大笑之。不笑不足以为道。这里的士就是指虚心度。 2⃣要重视灵机一触。现在有Google和维基百科两个伟大的网站存在(当时写的只有这两者,现在有chatGPT加入,更强了),客观上没有知识瓶颈,只有主观上的自我设限。有的时候一两个单词或字母你深入研究了,都可以带来可观的收益。比如我看到FHGC不知道啥意思,研究了一下,发现商业房产租约房东优势比较大,所以有了商业房产自动收入;而发现prebid和header bidding这两个词不知道啥意思,研究了一下,就从Adsense转到Header Bidding,网站收入又增加两倍;我儿子告诉我TradingView好用,我研究了一下,实现半自动化外汇交易的条件就成熟了。 ⏩在推特上看到太多人非粉即黑,没有必要。这是因为自己生活的不稳定性而有要找靠山的心态,而经济实现自由了,心灵就会自在,你不需要靠任何一边,这样就达到👇天下无敌👇的状态。