Panda
1天前
跟大伙分享一个很【变态】的心态,就是强迫自己去做,硅谷的说法大概叫 High Agency Introvert Execution 我一直是个典型的 C 端硅谷式创业者:最爱优化产品、研究分发,最讨厌和人打交道、去 social。 但我其实和朋友一起运营着一个 API 站点,已经快跑满三年了 早期叫 ,后来觉得名字没记忆点,现在改成了 起因很简单:我们自己训练模型时需要海量 API,一次造数据就要花十几万,干脆自己部署了一套,顺手分享给朋友用。 得益于我从科研圈退出的经历,用户几乎全是 B 端公司——美团、腾讯、各地的 Lab。 B 端圈子有个潜规则:你得定期去参加他们的各种活动。 这对我这种重度 i 人来说,简直是心理阴影。 可我早期还是硬逼自己去。活动其实没啥实质内容,就是过去捧个场。但我又不甘心把时间白白浪费掉,于是给自己定了个死 KPI,不断在心里默念: 【这次出来,必须加上五个看起来像潜在客户的商务/技术负责人的微信。】 就靠这个心理暗示,我开始逮着会场里坐在后排、频繁刷手机的人上去聊天。 他们一开始大多一脸懵(哈哈哈哈),但就这么认识了一大堆头部咨询、投研、战略部门的人,后来还推动了好几单长期合作。我早期搭讪真的特别木讷,估计所有人都看得出来,但大家其实都特别友善包容 我们目前还是只卖模型 API,没有 coding plan,可能在今天显得有点【落后】。1 月份试着转发过 Claude Code 和 Codex,但官方订阅封号率太高,根本维持不下去,所以跟客户说暂时都停了 付费模式也很透明:我们会明确告诉你用的是官方、Azure 还是逆向通道,按需选择。 我不喜欢行业里常见的【几块钱买一美元 token】那种说法——看着便宜,实际把模型单价又抬上去了 我们主要是因为企业用量大,能从 Azure/AWS 拿到比较好的折扣,就直接分享出来给大家用。这个业务的利润率我们一直只维持在 5-15% 之间 也没有外界传的那种中转站把 API 请求卖给大厂的事。不是道德洁癖,纯粹是 ROI 为负:用户请求的质量普遍很低,能达到 LLM 部门采购数据标准的只有 0.1-1‰,再加上标注、筛选、回扣,基本是亏本买卖。而且存一大堆数据还占存储和带宽,所以我们只保留 7 天,用户有问题可以随时追溯,7 天后自动清理 说了这么多,本来只是想分享这个【强迫自己去做】的心态,结果顺便聊了点行业内幕。 我们站点接下来会做一些面向 C 端用户的优化,有新进展再同步
Panda
2天前
Panda
1周前
一个融资复盘 24 年 7 月到 25 年 7 月,我几乎都在做合成数据 当时我就已经很确定:在 LLM 训练里,高质量合成数据会替代人工标注,因为它更便宜、更快,效果更好,而且不像人一样会出错 但那一波我最大的问题是不够坚定 当时我只和两家机构随便聊了聊,其中一位 VC 的管理人半开玩笑地说: “这不就是左脚踩右脚,模型效果怎么可能上天”,我知道这句话不对,但我不知道怎么反驳 还有一些朋友说这是生意模式,自己安心赚钱就挺好,不需要让机构进来 确实客观上被影响了一些心态,没认真推进 但背景好,24年底的时候有150万美元左右的真实数据订单,都是国内外大厂和AI公司,甚至找好了国央企招投标的代理商 而且这一轮我的股权非常干净,solo founder,顶多有两位顾问,股份加起来都不过2% 如果那时候认真聊 10 家,第一轮拿 200-300 万美元并不难。 然后借助机构的背书,同时认真做 12 个月,哪怕确实看不到下一步的趋势不想做了,也完全可以卖给 AI 公司或者具身的数据公司,让大家一起赚 3-5 倍 我创业是一晚上决定的。 当时模型火了,团队却要散了。别人觉得这是科研项目,发发论文就够了,但我不甘心一个已经被验证的产品就这么没了 所以我第二天就去跟导师说,退出北大,不读博了。 临时上路的代价,就是前期心智不成熟,也不懂怎么处理合伙人、投资人和客户关系 但这些坑,都踩过了 我前几年的积累只看到了两件事: 1. 合成数据会替代人工标注,Scale AI没有未来 2. 多模态搜索会成为主流入口 我已经错过我的判断一了 我开始准备给我的判断二 融资了,吸取教训 这次的原则是: 听不懂/有过多质疑的人,我们就不浪费彼此时间了 能听懂的人,我带你们至少赚5-10倍
Panda
3周前
继续整理一下这一轮的历史,说起来感觉23 24年好像是非常久远的过去,也很神奇了 23年的时候,字节的AI可以说就是一坨,那时行业里还觉得大厂有一惯的反应慢的问题。 但后来张一鸣是亲自下场了,不是象征性关注一下,而是高强度地见了大量researcher 和创业者。他会沿着近两年发过 LLM 相关论文、背景又不错的 researcher,一个个聊过去。与此同时,他也会去接触一些刚融过一轮钱、但方向和团队都很有潜力的 founder。那会如果你背景还不错,活跃在即刻,几乎都会被约 如果你这个人真的有价值,字节给你的方案不只是高薪,而是会把整件事一起解决。一边用非常强的现金、期权和汇报层级解决你的个人激励问题;另一边处理你原来公司的股权、团队、业务和投资人关系。然后拉进字节给千万的年薪并且直接向他汇报,一方面解决你的经济问题,一方面可以和最优秀的人一起工作,载入历史浪潮,几乎没有哪个优秀的人能抵挡这样的诱惑,因为和聪明人一起做有意义的事是非常爽的 随后字节迅速形成了一个很清晰的格局:火山偏 infra,Seed 偏 research,豆包偏产品。这套分工不是嘴上说说,而是外界后来能明显感觉到,它真的把基础设施、模型能力和产品落地串起来了。到24年底人们慢慢发现字节和从前的大厂不一样,它行动迅速,丝毫没有臃肿和迂腐的组织架构,流行的说法是“这头大象真的能跳舞” 另一边,23 年同期的 Qwen 逐渐击败 Baichuan、GLM 等模型,确立了自己的领导位置。半年之后,更多市场和普通投资者开始意识到这件事,阿里的股票也因为 Qwen 的领先叙事、AI 预期而一路走强。 但它并没有像字节那样,向外界呈现出一个特别清晰、特别强势、权责特别分明的 infra - research - product 协同格局。 只能说有点可惜
Panda
1个月前
发现自己慢慢有思想惯性了 OpenClaw 刚出来时,我第一反应是:这不就是一个接了 Discord/Telegram 的 Claude Code/Codex CLI 吗?当时还看过源码,觉得很多部分实现不够优雅。所以带火 Mac Mini 的时候,我是下意识抵触的 但一个多月过去,我看到的是它惊人的迭代速度,越来越完善的生态。OpenClaw 其实是一个非常好用的工具层。只要你把规则固定好——比如运营发帖的规则文档、每日要做的事情清单——你就能慢慢抛弃 N8N、手写的 CronJob、IM 的 Bot,把这些活全部交给 OpenClaw。你要付出的基本就只是一些 token 钱而已。 以前我说:可解释性根本不重要。何凯明前两年在 AI4S 的会议上说:“你坐出租车信任司机,你信任他是因为他的大脑是可解释的吗?还是因为受过训练、有经验的人类司机大概率能把事情做好。” 如果更近一步来看这个时代的产品:可解释不等于可预测。哪怕你能看到原理,你也预测不到生态、外部节奏、分发路径这些变量。 我之前一直非常抵触 VC 爱做比喻的习惯,什么法律界的拼多多、剪辑界的 Lovart、中国的 Scale AI……比喻确实能快速建立认知,但也会带来一种坏惯性:你以为你懂了,就开始用旧框架低估新物种。 所以我觉得要放下这样的心态,第一印象很重要,先纯粹地去感受它,不要去做比喻,不要去试图探究原理,单纯地去感受它是个什么东西,它有多酷、它让什么事情变简单了 这个习惯似乎是中登的预兆,所谓AI Native的人群一定是没有这样想法的,好在发现得早应该能改过来。“慢点来,你才26岁”;不,兄弟,我已经26岁了
Panda
1个月前
2022年北京冬奥会时,还没开始滑雪,对当时谷爱凌的讨论并没有多大的感受 这几年入门了单板双板,今天看比赛发现视角变了 常有人说“国人只关注奖牌,不在意比赛”,这话其实没错,但也情有可原。竞技体育是有门槛的,作为“门外汉”很难看懂复杂的动作难度和背后的体育精神。我们在本土选手夺冠后才大规模推送报道,本质上是因为大众对滑雪的认知还停留在起步阶段。很多人至今没滑过雪,通俗易懂的“比分”、“奖牌”自然成了唯一的讨论点。我觉得这是社会发展的现状,倒谈不上是谁的错。或许只有经济水平提升之后,才会有更多人愿意静下心来感受竞技体育本身的魅力 今天半夜醒来看了大跳台的全程,我看到的是谷爱凌在前两跳落后的情况下,坚毅的眼神。我想在那一刻,她站在大跳台的起点,内心一定是回归宁静的。理智地说,在排名基本定格且后续还有U池重头戏的情况下,为了避免受伤而选择保守方案才是常规逻辑。但她没有,她依然选择去完成了一记高质量的 1260 Tail Grab。 不去计算具体的分值,而是进入了“心流”状态——屏蔽掉外界的所有杂音,只专注自身 排名第一的 Megan 在前两跳锁金后,依然在第三跳挑战了漂亮的 1440;季军 Tabanelli 在夺冠无望的情况下,也做出了极其惊艳的 1620。刘梦婷即便面对诸多强敌,仍然有极其优美的 1440。 站在领奖台上的三个人,估计都没那么在意彼此到底第几名——更像是在尽情享受自己的比赛,享受把动作做出来那一刻的纯粹。 这种感受,我相信很多滑雪的朋友都能共情。我想起去年刚学会流畅换刃时,以前磕磕绊绊要滑一小时的山,第一次只用了10分钟就冲到了山底;第一次从公园的小跳台简单腾空再稳稳落地。那一瞬间,大脑是空白的,只有体内疯狂分泌的多巴胺在告诉自己:这感觉,真的太爽了。