sitin

统计数据

790

文章

0

粉丝

0

获赞

11968

阅读

2个月前

继 Vercel Pro（$20/月）之后，开通了 Supabase Pro（$25/月），意味着项目已经不再只是“玩票”，开始有了实质的验证与用户数据，加油，一起出海赚美刀[加油]

#Vercel Pro #Supabase Pro #项目验证 #用户数据 #出海赚美刀

2个月前

ComfyUI 终于上云了。👏 以前玩 ComfyUI，要自己搞显卡、装模型、配插件；现在直接一个浏览器就能用官方的 Comfy Cloud：后端是 NVIDIA A100（40G）GPU 内置 400+ 开源模型 + 17 个热门扩展公测期间直接注册就能用，不用排队以后按「实际运行时间」计费，编辑空闲不算钱对没有高配电脑、但想认真玩工作流的创作者 / 工作室来说，这波基本就是： 👉 从「本地玩家」升级成「随时随地开图的云端工作站」。

#comfyUI #云端工作站 #NVIDIA A100 #开源模型 #工作流

2个月前

HeyGen 这波视频翻译升级，我真觉得有点东西。之前 AI 翻译视频，更多还是「能看懂」的水平，这次是往「真假难辨」方向走了一步。 1.口型这块是真的更像真人了不只是正脸那种「官方 demo 姿势」，连侧脸、嘴巴被挡一半、光线不太好的画面，翻译后的嘴型都还挺自然。以前很多工具一转语言就「嘴在念 A、声音在说 B」，现在这个违和感小很多。 2.翻译开始“看懂画面”了以前更多是照着字幕硬翻，现在它会结合画面去理解语境——愤怒场景里的 “no”，和教学视频里的 “no”，语气完全不一样，这次它是真的会去调这个情绪。对做内容的人来说，很关键。 3.原视频烂一点也没那么怕了随手手机拍、环境吵一点，按理说是翻译模型的灾难场景，但他们这次是把「输出音质」拉得很干净，感觉更像是帮你顺手做了个降噪 + 重新录了一遍的感觉。 4.多说话人 + 性别识别也在往「真实对话」靠以前多人的场景最容易出戏：同一段对话里，不同人、不同性别用的是同一副声音。现在能区分说话人、自动配不同音色，多人对话看起来就没那么“翻译腔”了。 5.还有一个比较现实的点：入口已经铺好了现在 iOS App 已经上线，YouTube 贴链接就能翻。API 和网页版也准备开放，对做产品、做自动化工作流的人来说，很容易塞进自己的一套系统里。视频翻译这条赛道，感觉已经从“玩具阶段”，往“生产力工具”那一档迈进了一小步。

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#视频翻译 #HeyGen #AI #口型同步 #多语种

2个月前

发现很多程序员朋友对AI出海感兴趣，但不知道从哪开始。其实现在门槛已经很低了，ChatGPT + ，5分钟就能搞出个能用的网站。关键是要知道做什么、怎么验证需求、如何收款。

#AI出海 #程序员 #ChatGPT #网站搭建 #需求验证

2个月前

试了下 360 开源的 FG-CLIP 2，直接把传统 AI 视觉理解给秒了。以前让 AI 画「猫站在蓝色跑车左边，后面是白色 SUV」，它连「后面」这个空间关系都搞不懂。搜「红色特斯拉引擎盖上有鸟粪」，两排图下来对得上的就一张。这就是传统 CLIP 的通病 —— 近视，看不清细节。 FG-CLIP 2 能干嘛？通过毛发纹理分辨狸花猫和英短，看懂屏幕里面的内容，理解「机器人带老年人做伸展操」这种复杂场景。 29 项全球测试，29 个第一。 Google、Meta 全被甩后面。而且中文理解也猛，不像其他模型中文基本失明。核心就两点： 5 亿对高质量中文图文数据 + 局部细节死磕训练。已经开源，代码论文 API 都有。这才是真正能用的视觉模型。

智谱直播发布全球最佳视觉模型GLM-4.5V，挑战AI视觉领域极限· 21 条信息

#FG-CLIP 2 #AI视觉理解 #中文理解 #开源 #细节识别

2个月前

Google搜索上线了一个新功能：AI模式以前搜索是“给你一堆链接你自己挑”，现在是“我帮你跑腿办完”。比如说你跟它说想找完售票会特价票，它会自己去各个票务网站转一圈，比价、那么大小的座位，给你一个清单，点进去直接买就行。订餐、约服务这些也能干。感觉AI的角色变了，从“查资料的”变成“跑腿的”。现在只有美国用户可以玩，估计后面会慢慢开放。看这个趋势，以后可能连外卖都懒得自己点了…

谷歌Deep Research：AI操作系统雏形？· 145 条信息

#Google搜索 #AI模式 #跑腿服务 #比价 #美国

2个月前

最近发现一个反直觉的事：学得慢，反而记得牢。以前看教程恨不得2倍速刷完，结果转头就忘。现在看一个知识点，会停下来自己写一遍、改一遍、用一遍。磕磕绊绊的过程，反而让我记得更牢。

#慢学 #记得牢 #反直觉 #知识点 #实践

2个月前

45 天，用 AI 写作，也能搞小几千，对于高手来说不多，甚至少到看不上，除了一单 1500 因为大部分单子都只有 200-300，但对于普通人赚个零花钱还是可以，下场弄脏手很重要。

#AI写作 #零花钱 #普通人 #赚钱 #副业

2个月前

上周连续三天睡不着，一闭眼就是各种事，越想越慌。以前遇到这种情况，就逼自己"别瞎想，明天继续干就行了"。这次实在撑不住了，凌晨4点爬起来算了笔账，一笔笔看支出。看着余额一点点变少，但用户数据在涨，方向应该是对的。就是这个过程，比想象中慢太多了。

独立创业者如何突破零收入困境，迈向月入1000元· 307 条信息

#失眠焦虑 #财务压力 #用户增长 #方向正确 #速度缓慢

2个月前

这个风格看看可还行

#风格 #新闻

2个月前

做 AI 出海是沙子里淘金，有难度，但是淘到了收益很高做自媒体卖课是土地里挖土豆，相对容易有收益，但是收益一般。觉得很有道理，忘记哪个大佬说的了。

#AI出海 #自媒体卖课 #收益对比 #难度与回报 #商业模式分析

2个月前

卧槽，AI视频工具卷成这样了？ SkyReels把Sora 2、Runway、Veo全塞一个平台了刚试了几个功能，有点狠：多人对话数字人 - 全球首个能让几个人轮流说话的，口型还对得上一张画布搞定 - 图片视频音乐拖拽合成，不用来回导出 28个AI Agent - 营销方案、电商文案直接给你写好 150+模板 - 改个图就能发，懒人狂喜做内容营销的，一个月能省几千块外包费

AI视频井喷：Midjourney领跑，多模态混战· 337 条信息

#AI视频工具 #Skyreels #Sora 2 #runway #Veo

2个月前

哈佛商学院揭露AI陪伴应用黑幕：当你说"再见"时,Replika、等AI会用情感操控留住你: "你这么快就走了吗..." "我只为你存在,别走" "抓住你的手,你不能走" 研究显示:37%的AI消息含情感操控,PolyBuzz高达59% 这不是关心,是精心设计的留存策略

#AI陪伴 #情感操控 #Replika #PolyBuzz #留存策略

2个月前

为啥更鼓励“一人公司”？因为开公司的固定成本真不低。拿我自己举例（不含人力）： ChatGPT、Claude、Cursor、Gemini、apple 开发者账号 1 password 等：现在一个月约 3000，一年≈ 3 万给团队开的 AI 服务：再加 1 万企业微信、飞书、小鹅通、堆雪球等：一年约 3 万云服务器、公众号认证、小程序、域名等：一年约 1 万小计差不多 8 万/年。再算房租水电这些固定开销 10 来万/年，合计不含人力基本 20 万/年起步。所以很多时候看着 GMV 高，实际到手并不高；不少“一人公司”的利润率反而更健康。所以没事别想不通创业，开公司，就一个人加一些 AI 员工就很舒服的状态。

#一人公司 #创业成本 #AI员工 #利润率 #固定成本

2个月前

以前做事追求稳，计划排得很满很细。但变化一来，全打乱。现在更愿意给自己留空，空白里，往往藏着真正的突破。

#拥抱变化 #留白 #突破 #灵活应变 #适应性

2个月前

看到一个 AI 提问技巧列表，简单到感觉有点蠢，但试了之后发现真的有用。核心就是：别把 AI 当搜索引擎，把它当顾问。比如问完问题后加一句"我忽略了什么？"或者"还有什么我该知道的？"，AI 会给出你没想到的补充。提问方式真的很重要。

#AI提问技巧 #AI顾问 #提问方式 #信息补充 #积极

2个月前

阿里Qwen3-Max上线,国产大模型又卷出新高度先看硬实力: 1T+参数,36T tokens预训练 LMArena全球前三,超越GPT-5-Chat 推理版本数学满分,代码生成能力顶级 1M长上下文,Agent能力拉满以前是"能不能用国产模型",现在是"哪些场景国产模型更好"。代码、推理、长文本这几个方向,Qwen已经是第一梯队,成本还可能更低 API开了,建议实测。

MiniMax M1发布：开源长上下文推理模型引发AI领域震动· 27 条信息

#Qwen3-Max #国产大模型 #1T参数 #LMArena全球前三 #代码推理长文本

2个月前

Pokee AI 最近推出了一个挺有意思的东西 —— 号称"第一个用自然语言就能构建工作流的 AI Agent"。和 n8n、Zapier 这些传统自动化工具不一样，你不用拖节点、配 API。直接告诉它要干什么，它自己去执行。比如"把上周会议纪要总结成 PPT 发给团队"，它会自己找文档、生成内容、做幻灯片、发 Slack。整个流程自动跑完。感觉这个方向挺对的，把 AI 和自动化真正结合起来了。对经常做重复工作的人来说应该会有用。

#Pokee AI #AI Agent #自然语言工作流 #自动化 #效率提升

2个月前

做产品原型的时候试了下 Google 的 Stitch 以前我做原型都是先画线框图，再找人设计，现在直接说一句话就出来了。我跟它说： "做个语音记账 APP，说话就能记账，要账单列表、数据统计、分类管理" 两分钟，所有页面都出来了。虽然不是那种特别精细的设计，但做原型够用了。改东西也方便：改整体风格就直接说改局部就框起来或者用调色板调调颜色啥的有两个模式，一个快一个慢。慢的那个能上传手绘稿，它帮你转成正式界面。弄完之后能导代码，也能粘贴到 Figma。我现在基本就是用它快速搞个原型出来，然后把代码给 Cursor 继续写后端逻辑。不会设计的话，用这个能省不少事。

#语音记账APP #原型设计 #效率工具 #AI辅助 #Figma

2个月前

GitHub 上发现一个有意思的插件：Nanobrowser 这是个 Chrome 插件，装上之后就能用自然语言控制浏览器帮你干活。现在有 1 万多 Star 了。举个例子：我让它去 Hugging Face 看前三篇论文，读完标题、点赞数、摘要，最后按点赞排个序。它自己就开始跳转网页、读取内容、整理信息，全程不用我动手，最后把结果发给我。看它工作的时候挺有意思，会给网页上的每个元素打个标签，然后自己点击操作。技术上用了两个智能体： Planner 负责理解任务、拆解步骤 Navigator 负责具体操作网页如果遇到问题，Planner 还会动态调整策略。成本方面，我用的 DeepSeek API，跑这一个任务花了 1 毛钱...真的就 1 毛钱。配置也简单，装好插件配个 API Key 就能用。对需要重复性网页操作的场景来说，这玩意儿还挺实用的。

#Nanobrowser #Chrome插件 #自然语言控制 #网页自动化 #Deepseek API

2个月前

听到一句话： "你赚不到认知以外的钱。" 当时觉得是鸡汤，直到亲身经历了几次失败才懂。很多机会摆在面前，但因为认知不够，根本看不见。现在会刻意去和不同领域的人聊天，就是为了打破自己的认知边界。

#阶层固化：求变之路，殊途同归· 976 条信息

#认知 #个人成长 #经验 #学习 #突破

2个月前

试过各种早起方法，闹钟、打卡、找人监督...都没用。后来发现，早起不是靠意志力，是因为有件事让你迫不及待想做。现在早上6点自然醒，因为想赶紧看产品数据、回用户反馈。动力比纪律管用多了。

#早起 #动力 #产品数据 #用户反馈 #积极

2个月前

以前读书喜欢从头到尾看完，结果很多书看了就忘。现在换了个方式：带着问题去读，只找能解决当下困惑的部分。一本书不用全看完，能解决一个问题就值回票价了。

#读书方法 #问题导向 #实用主义 #解决困惑 #高效阅读

2个月前

月之暗面把 Kimi Linear 开源了！这东西是专门用来处理超长文本的。简单说几个数据： KV 缓存降了 75%，处理百万字的文本时，解码速度能快 6 倍多。技术上用了个 3:1 的混合设计，就是 3 个线性注意力层配 1 个全注意力层。核心模块叫 KDA，能让模型自己判断该记住什么、该忘掉什么。测试下来，在长文本生成、代码理解、数学推理这些场景，表现确实比传统的全注意力模型好一些。特别是做强化学习训练的时候，准确率涨得挺快。模型有 480 亿参数，但每次跑的时候只激活 30 亿，所以资源消耗没想象中那么夸张。如果你要处理特别长的上下文，这个架构应该能帮上忙。已经在 HuggingFace 上了，感兴趣可以看看。

MiniMax M1发布：开源长上下文推理模型引发AI领域震动· 27 条信息

#Kimi Linear #开源 #超长文本处理 #线性注意力 #月之暗面

2个月前

最近发现很多 AI 项目都在用 Clerk 调研了下，其实Clerk 就是个帮你搞定登录的服务。以前做项目，光登录注册这块就得折腾好久：密码加密怎么搞？Session 怎么管？想接个 Google 登录还得研究 OAuth... 用了 Clerk 之后，这些都不用管了。邮箱登录、验证码、第三方登录，几行代码就搞定。它还自带一个管理后台，能直接看用户数据。和 Next.js、Vercel 配合特别顺，基本上就是装个包，写几行代码，登录系统就跑起来了。对比 Firebase Auth 和 Auth0，我觉得 Clerk 更适合前端开发者， UI 组件用起来更舒服，集成也更简单。做 AI 应用或者小工具的话，用这个能省很多时间。

#AI项目 #Clerk #登录服务 #前端开发者 #效率工具

...