sitin
4天前
GitHub 项目——playwright-mcp,它是微软开源的一个 浏览器自动化 MCP,能让 AI 直接操作浏览器,就像真人一样。 1.它到底能干嘛? 举个例子: 我在 Claude Code 里随口输入一句话 它真的能自己打开浏览器 → 搜索 → 找到目标 → 自动评论。 而且我没给特别详细的路径指令,全是口语化描述,它照样能完成。 这就是它厉害的地方:AI 能听懂人话,自己去点网页、填表、评论。 2.怎么安装? 安装很简单: 在 Claude Code、CodeX 之类的 MCP 客户端都能用。 甚至你直接对 Claude 说一句“帮我安装 playwright MCP”,它会自动帮你装好。 装完后输入 /mcp 检查一下就行。 3.它为什么这么牛?(原理揭秘) 以前 AI 控制浏览器的方式是 截图 + 视觉模型,缺点是:慢、耗资源、还贵。 但 playwright-mcp 用的是另一套逻辑: Playwright:微软开发的现代浏览器自动化库,可以点、输、拖拽、拦截请求,几乎能模拟人类所有操作。 Accessibility Tree:相当于网页的“语义化副本”,里面是纯文本的结构化信息,比如“这里有一个搜索按钮”“那里有个输入框写着请输入关键词”。 AI 拿到的就是这个树,而不是图片。这样速度更快,成本更低,准确率更高。 你可以把它理解成一个团队: Playwright = 操作员,能点能输,但不懂逻辑。 Accessibility Tree = 操作员的口头汇报,“屏幕上有个搜索框,有个提交按钮”。 AI 大模型 = 盲人专家,虽然看不见,但能完全理解文字描述,然后下指令:“在搜索框输入内容,点搜索”。 这样一套配合,就让浏览器自动化变得又快又准。 4.总结 playwright-mcp = AI 和真实互联网之间的桥梁。 不用截图,不靠视觉,直接基于语义来操作网页。 简单、精准、低延迟,开源免费,还能直接用在 Claude Code 等环境里。
Y11
4天前
在一次人工智能行业峰会上,一位创业者上台做产品介绍,语气严肃地开口:“我们做了一个叫‘AI Naive’的产品。” 台下顿时响起一阵低低的笑声。身旁一位同行朋友轻轻碰了碰他的胳膊,小声提醒:“应该是‘Native’吧?可能口误了。” 创业者却像没听见似的,依旧保持着平静的表情,慢悠悠地解释:“没错,本来是‘原生AI’(AI Native)的意思。不过我们团队比较特殊,都是些刚毕业没多久的技术‘小白’,经验不足,能力还有限,最后能做成现在这样,已经算是从0到1突破了,就先叫‘Naive’吧,也算个纪念。” 这番话让原本有些尴尬的气氛缓和下来。他顿了顿,继续说道:“其实做AI,尤其是‘原生AI’,一开始大家都觉得我们是在不自量力。当时市场上要么是大厂的‘巨无霸’模型,要么是各种花里胡哨的概念炒作。我们这种小团队,既没有顶尖的算法专家,也没有海量的训练数据,能做的就是从最基础的需求出发,一点点打磨用户体验。” “有一次为了优化一个交互细节,我们几个技术人员连续熬了三个通宵,第二天眼睛都是红的。产品上线后,用户反馈说‘太简陋’,也有人说‘这也能叫AI?’我们没有辩解,只是默默记录下每一条评论,然后逐条去改进。” “现在回想起来,‘Naive’这个名字或许挺贴切的。我们确实是一群‘天真’的理想主义者,带着点不切实际的想法,在AI的浪潮里笨拙地向前走。但正是这份‘天真’,让我们没有被大厂的光环吓退,也没有被复杂的技术壁垒困住,始终坚持做真正能解决用户痛点的产品。” “今天站在这里,不是为了炫耀什么成果,而是想告诉大家:做AI也好,做任何事也罢,重要的不是一开始有多‘高大上’,而是能不能保持一颗‘初心’,能不能在一次次‘笨拙’的尝试中,不断靠近用户的真实需求。毕竟,所有伟大的创新,都始于一个看似‘天真’的想法,和一群愿意为之努力的‘小白’。” 台下渐渐安静下来,随后响起了真诚的掌声。或许,真正的创新,本就不需要华丽的包装,只需要一份敢于“笨拙”尝试的勇气和坚持。
Y11
4天前
看懂推荐算法:从数据到内容,它如何影响你看到的世界 推荐算法就像一位智能管家,每天根据你的喜好筛选信息。想知道它是如何工作的吗?我们用简单的步骤拆解这个过程,或许能帮你更好地理解信息如何触达你。 第一步:收集“原材料”——数据从哪里来? 算法的起点是数据,就像厨师需要食材一样。推荐系统主要依靠三类“原料”: 社交关系网:你关注了谁、谁关注了你,朋友之间的互动,这些关系就像一张无形的网,告诉你“你是谁的圈子”。 互动记录:你点赞、转发、评论、收藏的内容,这些行为是最直接的“喜好证据”。 个人信息:你的头像、简介、浏览历史,甚至你忽略了什么内容——这些细节都在悄悄告诉系统“你可能喜欢什么”。 第二步:给数据“贴标签”——特征工程如何理解你? 原始数据就像一堆杂乱的积木,需要“装修”成有用的信息。这一步被称为“特征工程”,系统会用各种工具给内容和用户打上标签: 社交关系图谱:实时追踪谁和谁互动,比如A关注了B,B又转发了C的内容,这些关系会被标记出来。 兴趣分组:通过模型把你和内容分到不同的“圈子”,比如“科技爱好者”“美食圈”,就像学校里的兴趣小组。 信任与安全:过滤垃圾信息、广告和你不喜欢的内容,就像门卫筛选访客。 第三步:筛选候选内容——从“海量库存”中挑重点 内容池里可能有成千上万条信息,系统需要先“捞”出可能适合你的候选内容,主要有两类: 你关注的人:从你已关注的圈子里选,比如你关注的博主发了新动态。 你可能感兴趣的人:系统会根据你的喜好,推荐一些你还没关注但可能合得来的内容,比如你常看科技,它可能推荐相关领域的新人。 这一步就像整理书架,避免你只看到同一类书,让内容更多元。 第四步:打分排序——神经网络如何决定“谁排前面”? 候选内容会被送进一个“打分机器”(神经网络),它会根据你可能的反应来评分,比如: 你会点赞这条内容吗? 会转发给朋友吗? 会花时间看完吗? 分数越高,内容就越容易排在你前面,就像考试分数高的学生更容易被老师注意到。 第五步:人工“微调”——让体验更人性化 AI打分后,人工规则会介入,让推荐更符合人的需求: 避免你连续刷到同一个人的内容,防止“审美疲劳”。 平衡内容类型,比如不会全是视频,也不会全是文字。 再次检查安全,过滤掉不合适的内容。 这些调整就像帮你整理房间,让环境更舒适。 第六步:最终呈现——你的“推荐页”是怎么来的? 最后,所有筛选好的内容会和广告、“关注谁”的建议一起,混合成你的“为你推荐”页面。你看到的每一条内容,都是算法和人工共同作用的结果。 普通人如何利用算法逻辑? 了解算法后,普通人也能找到自己的“增长密码”: 1. 专注一个领域:比如只分享摄影技巧,算法会更快识别你的定位。 2. 做有价值的内容:能引发点赞、评论的内容,更容易被推荐。 3. 积极互动:在领域内回复他人,能让更多人注意到你,提升可信度。 算法不是“敌人”,而是一位需要“沟通”的伙伴。理解它的逻辑,你就能更高效地表达自己,让有价值的内容被更多人看到。
Y11
4天前
过去七个月,AI领域的变化像潮水般涌来,有些我们已经能感受到,有些还在酝酿。先说说那些让我们能更轻松对话的工具,像N8N这样能自动生成节点的智能助手,已经悄悄出现在我们身边了。它就像一个贴心的小管家,能帮我们处理对话中的各种细节,让交流变得更顺畅。 再看视频创作,现在AI做视频的工具多到数不清,就像天上的星星一样。而且它们不再是千篇一律的,开始有了自己的专长,有的擅长做动画,有的特别会剪辑,满足不同人的需求。这就像餐厅里的厨师,有的专攻川菜,有的拿手粤菜,各有特色。 还有一个大趋势,就是把现实世界的东西变成虚拟世界的内容。现在有了3D模型和“世界模型”技术,我们拍的照片、录的视频,甚至家里的家具、街景,都能巧妙地变成游戏场景或者数字艺术,这就像给现实世界开了一扇通往虚拟世界的门。 语音交互也越来越普及了。以前我们用语音输入可能还会磕磕绊绊,现在大家已经慢慢习惯了,比如对着手机说“帮我订张票”,或者用像Wispr这样的工具和对方说话,就像打电话一样自然。这背后,是AI在语音识别和理解上的进步,让我们和机器的交流更像和人聊天。 说到机器人,虽然现在的机器人还不像电影里那样能帮我们做所有事,但资本市场对它的热情却很高,不少相关公司的股票都涨得不错。这就像人们对未来科技的期待,虽然现实还有距离,但想象空间很大。 AI资产的数字登记虽然还没正式开始,但相关的需求已经提出来了。就像我们买了房子要登记房产证一样,以后AI生成的图片、音乐、代码这些数字创作,也需要有专门的“身份证”,这才能更好地保护创作者的权益。 最近MCP(一种AI应用框架)特别火,谷歌的AP2(另一个AI项目)也发布了,就像行业里突然出现了新的“操作系统”,能让开发者更方便地搭积木、建模型,大大降低了AI开发的门槛。 还有一个现象,就是“一人公司”越来越多。像Base44这样的平台,让一个人就能快速组建小团队,完成项目。这就像现在流行的“斜杠青年”,一个人既能写代码,又能做设计,还能搞运营,灵活又高效。 虽然大公司还在裁员,但有一个方向特别缺人,就是懂AI的人才。不管是互联网大厂还是创业公司,都在抢这方面的人才,就像我们现在抢“网红”一样,谁有真本事谁就能被重用。 最后说说学习领域,成人教育里那些特别细分的“微专业”还没完全火起来,但是“氛围编程”相关的课程却越来越多。“氛围编程”听起来有点抽象,其实就是让编程变得更轻松、更符合人的情绪和工作环境,就像现在流行的“沉浸式办公”,让学习和工作都更有感觉。 总的来说,过去七个月,AI技术就像在搭积木,一个个新的工具、新的应用、新的需求冒出来,有的已经落地,有的还在成长。虽然里面有很多不确定性,但大方向很明确,就是让AI更懂我们,更融入我们的生活和工作。这就像我们在爬山,虽然路还很长,但每一步都能看到新的风景。
Y11
4天前
最近和一位AI领域的创业者聊了聊,感觉他对如何构建一家真正的AI公司,有一套非常清晰且深入的思考。在我接触过的AI创业者中,他是把这件事想得最透彻的一位。 现在市面上很多AI创业公司,往往是“草台班子”起步。很多时候,项目一开始就可能走偏了方向。但我觉得,真正能把AI公司做起来的创始人,通常会有几个关键特质和做法: 首先,他们会从一开始就倡导“AI优先”的文化。这意味着公司里的所有事情,都应该用AI的思维去审视和解决,让AI成为驱动一切的核心。 其次,他们会从“第一天”就开始搭建和设计评估系统,并且持续投入构建和迭代评估数据集。数据是AI的根基,没有高质量、持续更新的数据,AI模型就无法真正成长。 再者,他们会深入思考“智能体(Agent)”框架。很多公司可能会直接用现成的框架,但真正有远见的创始人,会考虑魔改甚至自己投入去构建适合自己业务的Agent系统。这就像造汽车,别人给的可能只是零件,自己设计的才是完整的、能跑起来的系统。 在市场定位上,这类创始人也很有深度。他们不会一开始就想讨好大众用户,而是会选择专业人士作为早期用户。因为专业人士能给AI提供更清晰、更有价值的反馈,帮助AI学习和成长;而大众用户往往只能给出模糊的意图,对AI的学习帮助有限。 他们还擅长“小步快跑”,在智能体上取得一些小的成功,同时着眼于沉淀认知资产。这些沉淀下来的东西,比如知识库、工具链、协作模式等,会成为公司的核心竞争力,让公司越跑越快,最终走向更广阔的未来。 对投资人,他们也保持着清醒的认知和极高的溢价力。他们清楚自己的目标,不会为了短期利益或资本压力而盲目扩张,始终坚持自己的战略方向。 在选择具体场景时,他们也很有章法。他们会评估哪些场景是传统方法做不好,但通过智能体却能有效解决的。这个场景不能太简单,否则沉淀不下有价值的东西;也不能太复杂,难以落地。它需要有一定的挑战性,能迫使团队去构建工具、知识库、多智能体协作,甚至强化学习等核心技术,这些最终会成为公司效率引擎的核心资产。 我觉得,这些应该是想做一家有长期价值的AI公司的基本要素。如果创始人在这些层面上犹豫不决、不够坚定,大概率是做不好一个真正的AI产品的。当然,不排除有些“草台班子”通过快速迭代,做个东西出来卖掉或者被收购,但如果真想在AI时代的这一两年里沉淀下有价值的东西,打造一个真正的AI公司,那么选对一个优秀的团队、做好这些基础工作,是非常关键的。
Morris
4天前
你以为天才的童年都充满了掌声?事实恰好相反,他小时候被同学骂怪胎,医生说这孩子社交能力为零,诊断书上甚至写着要么是天才,要么该进精神病院,连他的父亲都怀疑他脑子有问题。但20年后,这个被同学扔下楼梯的瘦弱男孩,把火箭送进了太空,把电动车卖成了全球潮流,把脑机接口装进了人类大脑。讽刺的是,那些当年被当成精神病的症状,现在全变成了他粉丝眼里的天才标志。而看完他的童年,也教会了我一件很重要的事。 今天我们就来聊一聊,这位人类未来规划师的小时候埃隆马斯克。1971年,马斯克出生在南非比勒陀利亚。三岁那年,母亲梅耶发现这孩子有点不对劲儿,喊他名字,他像没听见。吃饭时盯着盘子发呆,连勺子掉在地上都没反应,梅耶吓坏了,赶紧带他去看医生,结果医生说这孩子可能有听力障碍,得带助听器。但带了助听器的马斯克还是一样耳背。直到有一次梅耶在厨房做饭,突然听见马斯克对着客厅的收音机喊,不对,木星的卫星数量不是12颗,是16颗。梅耶冲出去,发现马斯克正盯着收音机里的天文节目,眼睛亮得像猩猩。原来他不是没听见,是自动过滤了不重要的声音。你能想象吗?三岁的小孩能记住大英百科全书里木星卫星的数量,能在大人聊天时突然插一句恐龙灭绝是因为小行星撞击不是火山爆发。能坐在沙发上连续看4个小时的科幻电影连厕所都不去,因为他的大脑里正在运行一个宇宙模拟器,外面的世界根本进不去。 梅耶后来在自传里写,埃隆从来不是没听见,他是没在意。当他专注于某件事时,整个世界都像被按下了静音键。这不是耳聋,是深度专注,一种科学家嘴里的心流状态。但在1970年代的南非,没人懂这个。老师说他多动症,同学骂他书呆子,连亲爹艾罗尔都骂他,你再这么发呆,以后只能去捡垃圾。马斯克十岁那年,爸爸给了他一台CommodoreVic20电脑。那是1981年,全球只有不到100万人用过个人电脑。马斯克拿到电脑的第一天就把说明书翻了十遍,然后对爸爸说,我要编个游戏。接下来的三个月,马斯克每天放学回家就坐在电脑前,手指在键盘上敲到出血。梅耶说,他连吃饭都要我端到电脑前,有时候我半夜起来,还能看见他的房间亮着灯,屏幕上全是我看不懂的代码。 12岁那年,马斯克的游戏Blaster做出来了,玩家操控飞船在宇宙中射击外星人,背景是他自己画的星空。他把游戏寄给了PC-and-Office-Technology杂志,结果杂志不仅刊登了,还付了他500美元。那是1983年,500美元能买一辆二手摩托车,但马斯克没买摩托车,他把钱全花在了科幻小说上,银河系漫游指南、沙丘2001太空漫游,堆了满满一书架。他对梅耶说,这些书里有未来的样子,比摩托车有意思多了。 你看,这就是马斯克的不正常。当别的12岁小孩在玩橄榄球追女生时,他在想,宇宙的边界在哪里?人类能不能移民火星?他的大脑里没有童年该做的事,只有我想做的事。马斯克的童年,一半是宇宙,一半是地狱。因为他不合群,同学总欺负他,把他的书包扔到楼顶,在他的午餐里放虫子,甚至把他按在厕所的地上打。有一次他被打得肋骨骨折,住了一个星期的医院,但马斯克没有哭,也没有找家长告状。他做了一件更奇怪的事,写小说,小说的名字叫The-Secret-of-the-Tomb,讲的是一个男孩发现了一座古老的陵墓,里面藏着外星人的科技,最后男孩用科技拯救了地球。 他把小说拿给梅耶看,梅耶问,你写这个是为了报复那些欺负你的人吗?马斯克说,不是我只是想告诉他们,我不在乎他们的拳头,因为我的未来在他们看不见的地方。后来马斯克在访谈里说,那些欺负我的人现在应该在加油站打工,或者在超市当收银员,而我在做他们连想都不敢想的事。你觉得这是记仇吗?我觉得不是,这是认知碾压。当别人用拳头解决问题时,他用未来解决问题。当别人活在当下的仇恨里时,他活在未来的希望里。 17岁那年,马斯克做了一个疯狂的决定,离开南非,去加拿大。理由很简单,南非实行种族隔离政策。马斯克觉得在这里,我永远做不了我想做的事。梅耶一开始反对,你才17岁,连英语都讲不利索,去加拿大怎么活?马斯克说,我可以打零工,可以睡地下室,只要能离开这里,我不想变成像爸爸那样的人。马斯克的爸爸埃罗尔是个成功的工程师,但也是个控制狂。他总对马斯克说,你要做稳定的工作,比如医生、律师,别搞那些没用的科技。马斯克反驳,稳定的工作就是稳定的浪费生命。 于是17岁的马斯克带着2000美元登上了去多伦多的飞机。他在加拿大做过农场工人,做过清洁工,做过软件程序员。最穷的时候,他住在朋友家的地下室,每天吃泡面,连暖气都舍不得开。但他说,那是我最快乐的日子,因为我终于可以做自己想做的事了。你看马斯克的叛逆从来不是和父母对着干,而是和普通人的生活对着干,他知道自己要什么,所以愿意放弃所有稳定,去赌一个不确定的未来。 1995年,马斯克从宾夕法尼亚大学毕业,拿着物理学和经济学双学位去了硅谷,那时候互联网刚刚兴起,所有人都在做门户网站、电商平台,但马斯克却做了一件没人敢想的事,做一个在线黄页,也就是后来的Zip2。朋友说,网页都是纸质的,谁会用在线的,你疯了吧。马斯克说现在没钱,但马斯克所有人都会用。结果Zip2在1999年被马斯克以3.07亿美元收购,马斯克赚了2200万美元,但马斯克没有停下来,他把赚来的钱全部投进了一个更疯狂的项目--PayPal在线支付平台,那时候信用卡还是主流,没人相信用电子邮件就能付钱,但马斯克说,未来的钱是数字的,不是纸质的。结果PayPal在2002年被一倍以15亿美元收购,马斯克赚了1.65亿美元。这时候的马斯克已经是亿万富翁了,但他还是不正常,他把PayPal的钱全部投进了两个不可能的项目,特斯拉电动车和SpaceX私人火箭。 朋友说电动车没人买,火箭会爆炸,你会破产的。马斯克说如果我不做,没人会做。结果特斯拉在2020年成为全球市值最高的汽车公司,SPACX在2020年把宇航员送进了国际空间站。你肯定会问马斯克为什么能成功?不仅仅是因为他明明是因为他敢相信不可能。当我们都在说这件事做不到时,他在想怎么做得到。当我们都在找失败的理由时,他在找成功的方法。 2023年,马斯克在Twitter上,也就是现在的X,发了一条推文,我小时候被认为不正常,但现在不正常变成了我的超能力。这句话其实是对我们所有人说的,我们总在追求正常,正常的工作,正常的生活,正常的思维方式。但马斯克告诉我们,正常其实是平庸的同义词。马斯克的不正常其实是对世界的好奇心,对目标的专注力,对未来的想象力。这些东西我们每个人都有,但我们都把他们藏起来了,因为我们怕被别人说奇怪,怕被社会排斥。 但马斯克没有藏,他把好奇心变成了火箭,把专注力变成了电动车把,想象力变成了脑机接口,他用自己的一生证明,所谓的不正常其实是未被发现的天赋。回顾马斯克的童年,我们看到的是一个充满矛盾的形象,一个被称为怪物的天才,一个在痛苦中寻找希望的孩子,一个将创伤转化为动力的创新者。他的故事告诉我们,所谓的正常可能只是一种平庸的妥协,而那些看似不正常的人往往能看到常人看不到的可能性,毕竟正常世界从来不是由正常人建造的。 马斯克曾经说过,当某件事足够重要时,即使成功率只有1%,你也应该去尝试。这句话不仅概括了他的创业理念,也反映了他的人生态度。从童年时被欺凌的怪物,到如今改变世界的企业家,马斯克用自己的经历证明,所谓的命运不过是一个等待被改写的故事。或许真正不正常的是我们对正常的定义。在这个快速变化的世界里,我们需要的可能不是更多正常的人,而是更多敢于打破常规、挑战极限的马斯克式人物。 我知道你肯定会说马斯克是天才,我不是,但我要告诉你,马斯克的天才不是天生的,是坚持做自己的结果。你小时候有没有过想做但不敢做的事?比如想当画家但怕养不活自己,想写小说但怕没人看,想创业但怕失败。其实这些不敢做,就是你藏起来的超能力。所以问问自己,你的不正常是什么?是喜欢熬夜写代码?是喜欢收集石头?是喜欢研究星座?不管是什么,把它找回来,因为那是你和马斯克之间最像的地方。 马斯克说过,当你做一件事时,不要问别人会不会做,要问我想不想做,因为别人的看法永远比不上自己的热爱。至今为止,马斯克成为世界上首位身价5,000亿美金的理想主义者。