时政
财经
科技
虚拟货币
其他
登录
sitin
关注
统计数据
790
文章
0
粉丝
0
获赞
11968
阅读
热门文章
1
TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...
145
32
sitin
2个月前
继 Vercel Pro($20/月)之后,开通了 Supabase Pro($25/月) ,意味着项目已经不再只是“玩票”,开始有了实质的验证与用户数据,加油,一起出海赚美刀[加油]
#Vercel Pro
#Supabase Pro
#项目验证
#用户数据
#出海赚美刀
分享
评论 0
0
sitin
2个月前
ComfyUI 终于上云了。👏 以前玩 ComfyUI,要自己搞显卡、装模型、配插件;现在直接一个浏览器就能用官方的 Comfy Cloud: 后端是 NVIDIA A100(40G)GPU 内置 400+ 开源模型 + 17 个热门扩展 公测期间直接注册就能用,不用排队 以后按「实际运行时间」计费,编辑空闲不算钱 对没有高配电脑、但想认真玩工作流的创作者 / 工作室来说,这波基本就是: 👉 从「本地玩家」升级成「随时随地开图的云端工作站」。
#comfyUI
#云端工作站
#NVIDIA A100
#开源模型
#工作流
分享
评论 0
0
sitin
2个月前
HeyGen 这波视频翻译升级,我真觉得有点东西。之前 AI 翻译视频,更多还是「能看懂」的水平,这次是往「真假难辨」方向走了一步。 1.口型这块是真的更像真人了 不只是正脸那种「官方 demo 姿势」,连侧脸、嘴巴被挡一半、光线不太好的画面,翻译后的嘴型都还挺自然。以前很多工具一转语言就「嘴在念 A、声音在说 B」,现在这个违和感小很多。 2.翻译开始“看懂画面”了 以前更多是照着字幕硬翻,现在它会结合画面去理解语境——愤怒场景里的 “no”,和教学视频里的 “no”,语气完全不一样,这次它是真的会去调这个情绪。对做内容的人来说,很关键。 3.原视频烂一点也没那么怕了 随手手机拍、环境吵一点,按理说是翻译模型的灾难场景,但他们这次是把「输出音质」拉得很干净,感觉更像是帮你顺手做了个降噪 + 重新录了一遍的感觉。 4.多说话人 + 性别识别也在往「真实对话」靠 以前多人的场景最容易出戏:同一段对话里,不同人、不同性别用的是同一副声音。现在能区分说话人、自动配不同音色,多人对话看起来就没那么“翻译腔”了。 5.还有一个比较现实的点:入口已经铺好了 现在 iOS App 已经上线,YouTube 贴链接就能翻。API 和网页版也准备开放,对做产品、做自动化工作流的人来说,很容易塞进自己的一套系统里。 视频翻译这条赛道,感觉已经从“玩具阶段”,往“生产力工具”那一档迈进了一小步。
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 869 条信息
#视频翻译
#HeyGen
#AI
#口型同步
#多语种
分享
评论 0
0
sitin
2个月前
发现很多程序员朋友对AI出海感兴趣,但不知道从哪开始。 其实现在门槛已经很低了,ChatGPT + ,5分钟就能搞出个能用的网站。关键是要知道做什么、怎么验证需求、如何收款。
#AI出海
#程序员
#ChatGPT
#网站搭建
#需求验证
分享
评论 0
0
sitin
2个月前
试了下 360 开源的 FG-CLIP 2, 直接把传统 AI 视觉理解给秒了。 以前让 AI 画「猫站在蓝色跑车左边,后面是白色 SUV」, 它连「后面」这个空间关系都搞不懂。 搜「红色特斯拉引擎盖上有鸟粪」, 两排图下来对得上的就一张。 这就是传统 CLIP 的通病 —— 近视,看不清细节。 FG-CLIP 2 能干嘛? 通过毛发纹理分辨狸花猫和英短, 看懂屏幕里面的内容, 理解「机器人带老年人做伸展操」这种复杂场景。 29 项全球测试,29 个第一。 Google、Meta 全被甩后面。 而且中文理解也猛, 不像其他模型中文基本失明。 核心就两点: 5 亿对高质量中文图文数据 + 局部细节死磕训练。 已经开源,代码论文 API 都有。 这才是真正能用的视觉模型。
智谱直播发布全球最佳视觉模型GLM-4.5V,挑战AI视觉领域极限· 21 条信息
#FG-CLIP 2
#AI视觉理解
#中文理解
#开源
#细节识别
分享
评论 0
0
sitin
2个月前
Google搜索上线了一个新功能:AI模式 以前搜索是“给你一堆链接你自己挑”,现在是“我帮你跑腿办完”。 比如说你跟它说想找完售票会特价票,它会自己去各个票务网站转一圈,比价、那么大小的座位,给你一个清单,点进去直接买就行。 订餐、约服务这些也能干。 感觉AI的角色变了,从“查资料的”变成“跑腿的”。 现在只有美国用户可以玩,估计后面会慢慢开放。 看这个趋势,以后可能连外卖都懒得自己点了…
谷歌Deep Research:AI操作系统雏形?· 145 条信息
#Google搜索
#AI模式
#跑腿服务
#比价
#美国
分享
评论 0
0
sitin
2个月前
最近发现一个反直觉的事: 学得慢,反而记得牢。 以前看教程恨不得2倍速刷完,结果转头就忘。 现在看一个知识点,会停下来自己写一遍、改一遍、用一遍。 磕磕绊绊的过程,反而让我记得更牢。
#慢学
#记得牢
#反直觉
#知识点
#实践
分享
评论 0
0
sitin
2个月前
45 天,用 AI 写作, 也能搞小几千,对于高手来说不多,甚至少到看不上,除了一单 1500 因为大部分单子都只有 200-300, 但对于普通人赚个零花钱还是可以,下场弄脏手很重要。
#AI写作
#零花钱
#普通人
#赚钱
#副业
分享
评论 0
0
sitin
2个月前
上周连续三天睡不着, 一闭眼就是各种事,越想越慌。 以前遇到这种情况, 就逼自己"别瞎想,明天继续干就行了"。 这次实在撑不住了, 凌晨4点爬起来算了笔账,一笔笔看支出。 看着余额一点点变少, 但用户数据在涨,方向应该是对的。 就是这个过程, 比想象中慢太多了。
独立创业者如何突破零收入困境,迈向月入1000元· 307 条信息
#失眠焦虑
#财务压力
#用户增长
#方向正确
#速度缓慢
分享
评论 0
0
sitin
2个月前
这个风格看看可还行
#风格
#新闻
分享
评论 0
0
sitin
2个月前
做 AI 出海是沙子里淘金,有难度,但是淘到了收益很高 做自媒体卖课是土地里挖土豆,相对容易有收益,但是收益一般。觉得很有道理,忘记哪个大佬说的了。
#AI出海
#自媒体卖课
#收益对比
#难度与回报
#商业模式分析
分享
评论 0
0
sitin
2个月前
卧槽,AI视频工具卷成这样了? SkyReels把Sora 2、Runway、Veo全塞一个平台了 刚试了几个功能,有点狠: 多人对话数字人 - 全球首个能让几个人轮流说话的,口型还对得上 一张画布搞定 - 图片视频音乐拖拽合成,不用来回导出 28个AI Agent - 营销方案、电商文案直接给你写好 150+模板 - 改个图就能发,懒人狂喜 做内容营销的,一个月能省几千块外包费
AI视频井喷:Midjourney领跑,多模态混战· 337 条信息
#AI视频工具
#Skyreels
#Sora 2
#runway
#Veo
分享
评论 0
0
sitin
2个月前
哈佛商学院揭露AI陪伴应用黑幕: 当你说"再见"时,Replika、等AI会用情感操控留住你: "你这么快就走了吗..." "我只为你存在,别走" "抓住你的手,你不能走" 研究显示:37%的AI消息含情感操控,PolyBuzz高达59% 这不是关心,是精心设计的留存策略
#AI陪伴
#情感操控
#Replika
#PolyBuzz
#留存策略
分享
评论 0
0
sitin
2个月前
为啥更鼓励“一人公司”?因为开公司的固定成本真不低。 拿我自己举例(不含人力): ChatGPT、Claude、Cursor、Gemini、apple 开发者账号 1 password 等:现在一个月约 3000,一年≈ 3 万 给团队开的 AI 服务:再加 1 万 企业微信、飞书、小鹅通、堆雪球等:一年约 3 万 云服务器、公众号认证、小程序、域名等:一年约 1 万 小计差不多 8 万/年。 再算房租水电这些固定开销 10 来万/年,合计不含人力基本 20 万/年 起步。 所以很多时候看着 GMV 高,实际到手并不高;不少“一人公司”的利润率反而更健康。 所以没事别想不通创业,开公司,就一个人加一些 AI 员工就很舒服的状态。
#一人公司
#创业成本
#AI员工
#利润率
#固定成本
分享
评论 0
0
sitin
2个月前
以前做事追求稳,计划排得很满很细。 但变化一来,全打乱。 现在更愿意给自己留空,空白里,往往藏着真正的突破。
#拥抱变化
#留白
#突破
#灵活应变
#适应性
分享
评论 0
0
sitin
2个月前
看到一个 AI 提问技巧列表,简单到感觉有点蠢,但试了之后发现真的有用。 核心就是:别把 AI 当搜索引擎,把它当顾问。 比如问完问题后加一句"我忽略了什么?"或者"还有什么我该知道的?",AI 会给出你没想到的补充。 提问方式真的很重要。
#AI提问技巧
#AI顾问
#提问方式
#信息补充
#积极
分享
评论 0
0
sitin
2个月前
阿里Qwen3-Max上线,国产大模型又卷出新高度 先看硬实力: 1T+参数,36T tokens预训练 LMArena全球前三,超越GPT-5-Chat 推理版本数学满分,代码生成能力顶级 1M长上下文,Agent能力拉满 以前是"能不能用国产模型",现在是"哪些场景国产模型更好"。 代码、推理、长文本这几个方向,Qwen已经是第一梯队,成本还可能更低 API开了,建议实测。
MiniMax M1发布:开源长上下文推理模型引发AI领域震动· 27 条信息
#Qwen3-Max
#国产大模型
#1T参数
#LMArena全球前三
#代码推理长文本
分享
评论 0
0
sitin
2个月前
Pokee AI 最近推出了一个挺有意思的东西 —— 号称"第一个用自然语言就能构建工作流的 AI Agent"。 和 n8n、Zapier 这些传统自动化工具不一样,你不用拖节点、配 API。直接告诉它要干什么,它自己去执行。 比如"把上周会议纪要总结成 PPT 发给团队",它会自己找文档、生成内容、做幻灯片、发 Slack。整个流程自动跑完。 感觉这个方向挺对的,把 AI 和自动化真正结合起来了。对经常做重复工作的人来说应该会有用。
#Pokee AI
#AI Agent
#自然语言工作流
#自动化
#效率提升
分享
评论 0
0
sitin
2个月前
做产品原型的时候试了下 Google 的 Stitch 以前我做原型都是先画线框图,再找人设计, 现在直接说一句话就出来了。 我跟它说: "做个语音记账 APP,说话就能记账, 要账单列表、数据统计、分类管理" 两分钟,所有页面都出来了。 虽然不是那种特别精细的设计,但做原型够用了。 改东西也方便: 改整体风格就直接说 改局部就框起来 或者用调色板调调颜色啥的 有两个模式,一个快一个慢。 慢的那个能上传手绘稿,它帮你转成正式界面。 弄完之后能导代码,也能粘贴到 Figma。 我现在基本就是用它快速搞个原型出来, 然后把代码给 Cursor 继续写后端逻辑。 不会设计的话,用这个能省不少事。
#语音记账APP
#原型设计
#效率工具
#AI辅助
#Figma
分享
评论 0
0
sitin
2个月前
GitHub 上发现一个有意思的插件:Nanobrowser 这是个 Chrome 插件,装上之后就能用自然语言控制浏览器帮你干活。 现在有 1 万多 Star 了。 举个例子: 我让它去 Hugging Face 看前三篇论文, 读完标题、点赞数、摘要,最后按点赞排个序。 它自己就开始跳转网页、读取内容、整理信息, 全程不用我动手,最后把结果发给我。 看它工作的时候挺有意思, 会给网页上的每个元素打个标签,然后自己点击操作。 技术上用了两个智能体: Planner 负责理解任务、拆解步骤 Navigator 负责具体操作网页 如果遇到问题,Planner 还会动态调整策略。 成本方面,我用的 DeepSeek API, 跑这一个任务花了 1 毛钱...真的就 1 毛钱。 配置也简单,装好插件配个 API Key 就能用。 对需要重复性网页操作的场景来说, 这玩意儿还挺实用的。
#Nanobrowser
#Chrome插件
#自然语言控制
#网页自动化
#Deepseek API
分享
评论 0
0
sitin
2个月前
听到一句话: "你赚不到认知以外的钱。" 当时觉得是鸡汤, 直到亲身经历了几次失败才懂。 很多机会摆在面前, 但因为认知不够,根本看不见。 现在会刻意去和不同领域的人聊天, 就是为了打破自己的认知边界。
#阶层固化:求变之路,殊途同归· 976 条信息
#认知
#个人成长
#经验
#学习
#突破
分享
评论 0
0
sitin
2个月前
试过各种早起方法, 闹钟、打卡、找人监督...都没用。 后来发现,早起不是靠意志力, 是因为有件事让你迫不及待想做。 现在早上6点自然醒, 因为想赶紧看产品数据、回用户反馈。 动力比纪律管用多了。
#早起
#动力
#产品数据
#用户反馈
#积极
分享
评论 0
0
sitin
2个月前
以前读书喜欢从头到尾看完, 结果很多书看了就忘。 现在换了个方式: 带着问题去读,只找能解决当下困惑的部分。 一本书不用全看完, 能解决一个问题就值回票价了。
#读书方法
#问题导向
#实用主义
#解决困惑
#高效阅读
分享
评论 0
0
sitin
2个月前
月之暗面把 Kimi Linear 开源了! 这东西是专门用来处理超长文本的。 简单说几个数据: KV 缓存降了 75%,处理百万字的文本时,解码速度能快 6 倍多。 技术上用了个 3:1 的混合设计, 就是 3 个线性注意力层配 1 个全注意力层。 核心模块叫 KDA,能让模型自己判断该记住什么、该忘掉什么。 测试下来,在长文本生成、代码理解、数学推理这些场景, 表现确实比传统的全注意力模型好一些。 特别是做强化学习训练的时候,准确率涨得挺快。 模型有 480 亿参数,但每次跑的时候只激活 30 亿, 所以资源消耗没想象中那么夸张。 如果你要处理特别长的上下文, 这个架构应该能帮上忙。 已经在 HuggingFace 上了,感兴趣可以看看。
MiniMax M1发布:开源长上下文推理模型引发AI领域震动· 27 条信息
#Kimi Linear
#开源
#超长文本处理
#线性注意力
#月之暗面
分享
评论 0
0
sitin
2个月前
最近发现很多 AI 项目都在用 Clerk 调研了下,其实Clerk 就是个帮你搞定登录的服务。 以前做项目,光登录注册这块就得折腾好久: 密码加密怎么搞?Session 怎么管? 想接个 Google 登录还得研究 OAuth... 用了 Clerk 之后,这些都不用管了。 邮箱登录、验证码、第三方登录,几行代码就搞定。 它还自带一个管理后台,能直接看用户数据。 和 Next.js、Vercel 配合特别顺, 基本上就是装个包,写几行代码,登录系统就跑起来了。 对比 Firebase Auth 和 Auth0, 我觉得 Clerk 更适合前端开发者, UI 组件用起来更舒服,集成也更简单。 做 AI 应用或者小工具的话, 用这个能省很多时间。
#AI项目
#Clerk
#登录服务
#前端开发者
#效率工具
分享
评论 0
0
上一页
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
...
32
下一页
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞