凡人小北

统计数据

78

文章

0

粉丝

0

获赞

2023

阅读

1天前

竞争密度过高，市场进入红海阶段。

1周前

Mac mini 已下单，直接上万兆口。虽然我现在也说不清具体拿来干嘛，但路子先铺宽点，AI干活总归更猛一点吧。明天到货。等我给它开个光，看看我的 AI 能不能直接起飞。

3周前

DeepSeek 去年春节开了个坏头，结果今年一看，国内大模型全体开始卷春节。上一次这么打仗的是阿里和京东的 11.11、6.18，这味道太熟了。节日流量 + 红包补贴 + 心智抢占，互联网老三件套。

3周前

突然想起大学时候一个特别有时代感的瞬间。有次上课，老师讲到 8/90 年代的往事，说当年北京大学有个老教授跟学生讲：你们不用学编程，学好理论就行。代码这种活儿，交给程序录入员。他说到这，全班直接笑炸。在我们一代人眼里，这话简直离谱到像段子。写代码是核心能力，怎么可能外包给“录入员”。但这就是时代，因为再往前拨动时钟，真的有程序录入员这个角色存在。结果这两年我们真做的事又变成了：想清楚要什么，把思路说清楚，然后看它把代码敲出来。好像我们当年嘲笑的程序录入员，绕了一大圈，变成了 AI。历史有时候真的挺黑色幽默的。

1个月前

折腾了几天 skill，突然有点感慨。技术这东西，跟时尚一样，真的就是一圈一圈在转。小学初一那会上电脑课，老师在黑板上写满 DOS 命令，我在小本子上抄一页又一页。屏幕就那么大一点，对着命令敲，能玩一整节课都不腻。那个时候 windows 已经有了但学校引进的慢。后来到初中后半段高中，Windows 彻底普及了。也说不上来能干啥，敲敲字、学学 Office，折腾网页三剑客，插着软盘玩超级玛丽、打打红警魔兽，那会儿已经觉得挺高级。大学开始接触 Linux，天天泡在 terminal 里折腾 shell。怕记不住命令，直接打印出来贴在宿舍墙上。开发环境是 vim 加一堆插件，自称 geek。那时候的鄙视链也很直接，C/C++ 秒一切。再后来工作了，IDE 越来越智能，才慢慢意识到 UI 真香。点点点能解决的事，真没必要折磨自己，一路顺滑。然后到了这几个月，skill 出来了，画风又突然一转。大家集体回到 terminal 时代，玩得不亦乐乎。不同的是 command 变成了自然语言，相同的是那种直接操控的爽感。当然，进化还在继续。图形化速度在加快。只是兜兜转转，真正拉开差距的还是基础底座的能力，不管是 windows 还是 linux，又或是现在的大模型。基座一旦立住了，万物自然就开始生长。

1个月前

开发一个垂类 agent，认真做下去，其实 99% 的问题都能解决掉。剩下那 1%，每往前啃一点，边际成本都是指数级往上窜。但真正的阻力往往就卡在这 1% 上：阻力来源基本不太关心 99% 的链路已经被自动化成什么样，但一定会死盯着那几个极端 case 不放手。可人又何尝能做到 100%？没有客服能永远答得滴水不漏，没有运营能照顾到所有场景，没有项目能保证零事故。这就是做 AI 产品的错位现实：工程视角看的是整体覆盖率和边际收益，阻力视角看的是安全感。所以最终决策回到一句话：到底要为 99% 买单，还是要为那 1% 付出无限成本？想清楚这件事，就知道 agent 什么时候该做到什么程度，毕竟，100% 这个指标连人类都做不到。

1个月前

太喜欢确定性，大概率会一事无成。这是很多打工人乃至整个职场文化里最普遍的惯性：怕犯错、怕赌方向，于是大家都争着做能看见结果的事。可创新恰恰相反，真正改变局面的工作几乎都诞生在 KPI也解释不了的模糊区域。最近的一些心得：稳健本身没错，但每天只做确定正确的事其实是最高风险策略。那20%的成功概率不会留给站着观望的人。有时候孤注一掷是个褒义词。

2个月前

这个 repo 有点牛逼，把一整套科研 + 医疗的复杂流程，直接拆成了可复用的 AI 能力块。 138 个 scientific skills，包含文献、组学、药物发现到临床研究、报告生成，我能想象到的医生和药企的一整套流程都在里面了。随便拎几个出来，封装成 AI scientist 产品，剩下的就是去卖了。这种 repo，看的人不多，但看懂的人，基本都知道它值钱在哪。

2个月前

《人工智能拟人化互动服务管理暂行办法（征求意见稿）》来了。从什么时候开始算拟人、服务边界在哪、哪些场景红线最先落地，都开始有了明确框架。几个关键词： - 情感边界识别 - 依赖风险预警 - 未成年模式强管控 - 专业领域并轨监管（医疗法律金融） - 百万级用户安全评估（上线→变更→复审）国内的情感陪伴类 AI过去大多靠隐性设计逻辑在跑，现在得去认真读一遍，合规先行，这可能是接下来行业的地基。

2个月前

管理为什么累？因为leader既在当司机、又在当导航、还要下车修路。久而久之，团队变成了乘客，leader 变成了全职代驾。累，是因为所有变量都在leader身上闭环。 leader 不给团队试错空间 → 团队不敢动也不敢犯错 → leader 觉得“还是我来吧更省事” → 于是继续亲力亲为 → 团队没成长，leader 更累 → 死循环就这么闭上了。这套结构把增长的成本都压在自己身上，把试错这件事当成奢侈品。如何破局？放手！但不是完全放手，要同步设计试错的护栏： 1. 给边界：能亏多大？能延误多久？风险点是什么？ 2. 给回路：出错以后怎么复盘？怎么归因？怎么反馈到系统？ 3. 给权限：决策带宽从 leader 迁移到被规则托底的团队 4. 给闭环：试错不要放飞，要变成有交付节奏的实验 leader 要学会放手，从代驾跃迁成裁判。

2个月前

美团把部分前端整体转到后端做全栈。这类组织结构的变化在 AI 时代就是必然的，现在开始规模化落地了。直觉明年会看到越来越多类似的动作。 AI Coding 有三个趋势已经压不住了： 1. 某些产品线要快，组织会自然偏向全栈，能单点闭环的就更有价值。 2. 岗位边界在快速消失，前后端只是历史阶段的分工，不是未来的分工。 3. 能闭环的人越来越贵，不能的人越来越难，这是现实也是趋势。防喷补充：岗位不会消失，但岗位形状正在重塑。挺值得观察的一个趋势。

3个月前

半年前我写过一个故事，结论是经验主义在 AI 时代会变成一种思维惯性，模型更新太快了，很多时候经验是锚住你脚的那块石头。当时只是个项目插曲，一个十年经验的算法工程师被敢乱试的实习生打得措手不及。没想到半年后，这位同事最后还是走到了被淘汰这个词上。当其他人借助AI/AI coding产出成倍提升的时候，他还在原地踏步。人挺好技术能力也在，只是时代往前跑，他没跑。最让我记忆深刻的是在数月前几十人的会上，他特别认真地说： “不能让 AI 帮你 coding，把核心能力让出去，你未来怎么竞争？” 我当时公开批评过，但心里也很清楚，你永远也无法叫醒一个装睡的人。真正让竞争力消失的从来不是 AI，你越是不愿接触新的东西，越会被时代的平均速度悄悄甩得更远。 AI 没有偏向谁也没有要害谁，它就是继续往前。能不能跟上，是每个人自己的选择。别抱着旧的护城河不放，一定要时刻保持拥抱变化的肌肉记忆。时代真的变了。

3个月前

本来大家都以为 AI 的剧本已经写死了：模型看 OpenAI，芯片看英伟达。结果 Gemini 3 一出，剧情突然就反转了。 Google 除了大秀模型，还把真正的杀招摊开摆在桌上，TPU 不止在云里跑，现在要进 Meta 的机房。市场瞬间整明白了：Google 想建立的一条完整的谷歌链开始成型了。听懂的也包括Nvidia，谷歌刚给 Anthropic 扔了 100 万片 TPU，黄仁勋立刻回手几十亿投资，把对方再锁回 GPU 阵营。动作跟被谁刺了一刀一样麻利。划重点，这是第一次有人证明除了 GPU，TPU 也能撑起最强模型。而且还便宜省电。以后英伟达的日子就不会再像去年那么舒服了。故事还没完，但很明显： Google 掺合进来后已经开始改写 AI 的供应链叙事，英伟达也得开始算一笔从没算过的账。看好 Google。

Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#Gemini 3 #Google TPU #英伟达GPU竞争 #AI供应链重塑 #谷歌生态

3个月前

nano banana pro 还有提升空间。墙上画报里的汉字有点问题。

#Nano Banana Pro #提升空间 #汉字问题 #墙上画报

3个月前

真正打动面试官的，从来不是完美到无可挑剔的回答，而是：候选人身上展现出来的稳定、诚实以及可托付的气质。

#面试 #稳定 #诚实 #可托付 #气质

3个月前

我前阵子远程面试一个候选人，已经是第三面了。技术能力基本没什么问题，前两轮同事都给了正反馈，我这里更多是确认一些细节和判断稳定性。技术能力基本没什么太大问题了。线上面试，用腾讯会议。这小伙子回答得特别利索，就是那种确实有实力，但好像又完美得有点不自然的感觉。不过整体我还是满意的。然后他非要演示他的 Agent 作品。我都已经准备让他通过了，就说行，你演示一下。结果他一打开共享屏幕，可能紧张选错了应用，直接自爆。满屏密密麻麻的面经。说实话，我并不觉得他没能力。他八成是真的会，就是不够自信，想把这轮稳稳过。如果我是他，我可能也紧张。但现实是很多公司非常在意这种事。能力是可以补的，但诚信掉下去，就补不回来了。可惜了，如果他不这样搞，他其实已经很稳了。

#面试 #候选人 #技术能力 #诚信 #自爆

3个月前

听到一个字节面试官远程面试候选人，如何抓对方用 ai 作弊的方法，朴素到离谱。面试官突然说：你闭上眼睛回答这道题。

#字节跳动 #面试 #AI作弊 #远程面试 #离谱

3个月前

看推友今天刷了半墙 Gemini 3 的前端测试，说一句不好听的： Gemini 3 不是在帮前端写代码，它是在替前端写代码。注意帮和替的一字之差，前者是放大器，后者是吞掉。当然前端不会消失，但基本可预见只会写前端的人会被机器秒成一地灰。我过去的观点是： AICoding 一定是模型最先爆发的赛道，而前端是最先被爆的赛段。现在我还是这个观点。

#Gemini 3 #前端开发 #AI Coding #自动化 #行业变革

3个月前

Andrej Karpathy 这个阅读方法有点意思… 大概就是：先自己把文章/章节从头到尾过一遍，把大轮廓先搭起来；第二遍丢给 LLM 解释 + 总结，看看它怎么梳理；第三步直接开 Q&A，把想深挖的地方一个个怼出来问。很有意思，阅读这件事从一个人对着文本死磕变成一个人和一个 AI 一起拆书。这种方法能很好的解决之前那种看完了但有没什么留下来的浅刷。有人也是这种阅读习惯吗？

#LLM #阅读方法 #AI辅助 #知识获取 #拆书

3个月前

Google 在 Gemini 生态里直接宣判了 RAG 的死刑。这个 File Search 一句话就能概括： Google 把 RAG 从工程领域直接删掉了。以前做 RAG 是一整条流水线：切 chunk → embedding → 向量库 → 检索策略 → 引用链路 → 缓存优化 → prompt 拼装。现在 Gemini 的 File Search 非常简单，把PDF/JSON/代码/Markdown 扔进一个 store，然后问问题。剩下全部交给模型。不需要理解 RAG，也不需要设计 RAG，甚至不需要知道 RAG 曾经长什么样。就这么简单，整个 RAG 技术链路的所有复杂度不可逆地被压到平台底层。 AI 应用的门槛又被 Google 掐了一次脖子。我也没想到有一天模型厂商竟然用这种方式吞掉了技术。

谷歌Deep Research：AI操作系统雏形？· 145 条信息

#Google #Gemini #RAG #File Search #AI应用

3个月前

还记得去年 Devin 搞了一个 deepwiki 吗？ Google 现在也悄悄上了一个同类，Gemini 加持的CodeWiki：用法超级简单：把 GitHub 的项目仓库地址，直接贴到 CodeWiki 的 URL 后就行。比如 LangChain 的 repo：那么它对应的 CodeWiki 页面就是：私有仓库马也上会支持，据说 Google 在开发 Gemini CLI 扩展，企业内部 repo 也能用。所有做工程的人都知道一句残酷真相：写代码从来不是效率瓶颈，理解代码才是。尤其是大型仓库，文档永远跟不上代码，逻辑全靠口口相传。如果代码-文档-知识这条链路能打通，工程效率这块真的要再往前跳一级了。

谷歌Deep Research：AI操作系统雏形？· 145 条信息

#CodeWiki #Google #Gemini #代码理解 #工程效率

3个月前

AI 真正落地最快的，其实是那种只需要工程师、不需要任何其他部门配合的场景。一旦项目需要经过多部门共识，开十个项目群，甚至要同步半个公司的业务，节奏立刻慢十倍。这种牵扯 KPI、人情、责任边界等一系列问题的场景，AI 能直接从工具变成政治。现实就是这样：能让工程师直接落地的事，一周就能上线；要开完三个会才能定方向的事，一年过去了都还在讨论可行性。

#AI落地 #工程师主导 #跨部门协作障碍 #效率低下 #政治化

3个月前

好家伙，这两天 X 上全是 Google，这次是直接把 Gemini 塞进 Maps 了，这是我最近看到最有生活实用性的 AI 原生落地了。看了太多的你说我答型的演示型智能，这种能做导航多轮规划的能力让人眼前一亮。比如找一家两英里内好停车的素食玉米饼餐厅这种，一句话就能搞定路线+店铺+车位+到达时间，这才是真正听得懂人话的导航助手。这就是我一直在说的： Google 的强，不只是模型，还有生态和深度。期待 Gemini 再更新几版，一年后可能会炸得比现在想象的更大。

Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#Gemini #Google Maps #AI导航 #实用性 #生态

3个月前

你以为 Gemini 3 还没发是因为没准备好？不是的兄弟，2.5 Pro 还够用，甚至在知识，规划和头脑风暴上，都能硬刚所有顶级模型。所以根本不着急，现在全域工具链串成一套闭环这件事儿，可以理解成是再做生态总动员。别忘了 Gemini 3 只是没发而已。等 Gemini 3 发出来的时候，可能是 Google AI 的系统性爆发。所以说，该加仓的，别等新闻稿出来才上车。

Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#Gemini 3 #Google AI #生态系统 #知识规划 #系统性爆发

3个月前

Google 最近整合明显在加速，想多了能让头皮发麻那种。产品+AI 我认为做到了生态一体和智能自洽。来看两个关键点： 1. 生态的统一智能层全线产品智能化，特别是给 Gemini 开了权限，就能一口气调用 Gmail、Drive、Chat 的内容，不用上传也不用提醒，它直接就知道我想找啥。这是 Workspace 的智能操作系统。 2. 知耻而后勇式进化 Gemini 一开始大家都在骂，但这一波是真转身了。直接融入 Workspace，成为工作记忆体 + 自动助理。关键点在于它聪明，并且它知道得也太多了。这就是 Google 的可怕之处：首先模型强，然后数据闭环 + 应用集成 + 权限整合全部打通。当别人搞 AI + 工具的时候； Google 说：我不跟你们玩，我搞的是 AI = 工具。幸好这些年我一直没放弃 Google，这也算是某种意义上的坚守回报了。既然 AI 是能力放大器，我也想看看 Gemini + 我在Google 生态里的内容，Gemini能给我放大多少倍。

Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#Google #Gemini #AI生态 #workspace #智能化