宝玉
2个月前
根据Replicate官方博客11月17日发布的消息,AI模型部署平台Replicate宣布将加入Cloudflare。 Replicate是一家致力于构建“AI原生工具”的公司,旨在让软件开发者能更轻松地使用AI,而无需深入了解其底层的复杂技术。他们开发了开源工具Cog(一种标准化的模型格式)以及Replicate平台,允许开发者分享AI模型并通过API运行它们。 公告将这些AI工具比作在云端运行的“分布式操作系统”。因为运行AI模型需要专业的GPU和庞大的集群,所以“网络就是计算机”。 而Cloudflare拥有全球领先的网络,并且已经构建了这个“操作系统”的许多其他部分,例如用于运行代码的Workers、用于管理状态的Durable Objects以及用于存储的R2。 为什么合并? Replicate认为,通过将其底层的AI抽象(如模型运行、数据输入输出)与Cloudflare强大的开发者平台相结合,双方可以构建更高级别的AI工具,例如用于编排模型、构建AI代理(Agents)以及在边缘运行实时模型。 对用户有何影响? 公告明确表示,Replicate将继续作为一个独立的品牌运营,并且会变得“更好”——速度更快、资源更充足。 对于现有用户最关键的信息是: - API不会改变。 - 用户当前使用的模型将继续工作。 - 所有构建在Replicate上的应用将继续照常运行。 Replicate的联合创始人表示,Cloudflare是构建Web应用的默认选择,而通过这次联手,他们的共同目标是成为“构建AI应用的默认选择”。
苍何
2个月前
花了一个月做出了个辣鸡视频,但折腾很值得! 分镜、脚本、A-roll、B-roll,obs、snape camara、screen studio工具踩坑经验特别值得分享。 写了很久文章,一直不敢碰视频,永远以麻烦为借口。 直到听人说,完成比完美重要。 所以才有了这个视频。虽说品次和专业人做出的差距很大,但终于算是完成了。(差细致的剪辑) 分享一些我用到的工具吧: 1、换脸 暂时还不想露脸,折腾了半天找到snap camara在mac上可以实时换脸,不过非常麻烦,单独搞个推说。 2、录制 用的screen studio,缩放、人像录制、提词器等都很齐全,视频源转到snape camara 3、obs虚拟摄像机 obs这里只是作为虚拟摄像机使用,obs需要开启滤镜,选择色值,配合绿布换背景。然后在snape camara选择源是obs的虚拟摄像机。 4、录像 录像用的iPhone后置摄像头,清晰度和相机比不了,但也够用了。 5、麦克风 接的大疆的mini3麦克风,开启降噪模式 6、分镜脚本 配合使用ChatGPT、gemini,出方案,改了几遍。 7、视频剪辑 用的剪映,刚冲的会员,功能特别齐全。 8、视频同步 用的之前分享过的多平台同步插件,上传同步。 目前视频存在很多问题,我感觉做视频就跟开发产品一样,先出来个MVP比较重要。 毕竟我已经想做这事想了好几年了,今天总算做了,折腾很久,立个帖子,做下分享,也欢迎大佬多交流指导,我是真的想做好啊。
向阳乔木
2个月前
昨天终于有空看了段永平的访谈,1.5倍速看完。 我不太关心炒股。 但关于AI和教育,他的很多观点,很犀利,很认同。 今天用Notebook总结下。 AI到底是个什么东西? 段永平的判断很直接:这是工业革命级别的变革。 但他马上补了一句:泡沫肯定也会跟着来。 他形容AI的进步:不是"上了一个台阶",而是 "上了一万个台阶"。 段永平举了自己的例子: 以前,想了解一家新公司,得花几天时间研究报告、财报、新闻 现在,问问AI,几分钟就能有个大致框架。 他还说,现在连动画是真人还是AI做的都分不清了。 电影、写作、设计……很多行业都在被重构。 普通人该怎么办? 段永平说的很实在: "不要说自己学不会,其实是可以学会的。" 他观察到身边很多朋友,过了四十岁就不愿意接受新东西了。 “但AI这波浪潮,你躲不过去。” “至少要知道AI能帮你做什么,怎么用它提高效率。” “否则,日子会过得很艰难、很痛苦。” 上面是他的原话。 段永平的投资逻辑一直很清晰:看懂生意,找护城河。 在AI这件事,他也是这个思路。 他以前不碰半导体,觉得变化太快、太难做。 但现在他发现 英伟达的生态真的很强。 他是通过OpenAI的两则合作新闻,做的判断 英伟达跟OpenAI合作:我投你10亿美元,但要用我的芯片,还要拿你的股份。 AMD跟OpenAI合作:求求你用一用我的芯片,我还给你股份** 看出差距了吗? 这就是英伟达的垄断实力。 段永平很欣赏黄仁勋。 说他十多年前讲的东西和现在讲的一样,一直朝着一个方向走。 长期主义是真正的护城河。 段永平观察到,台积电把竞争对手都"干掉"了,现在找代工的都得找它。 虽然最近股价涨得离谱,但他觉得如果AI真的按黄仁勋说的那样发展,现在的价格是有道理的。 (虽然他没买台积电吧?) 段永平一直喜欢Google,但现在开始担心AI对搜索业务的冲击。 不过,他说自己也说不准。 对炒股的人来说呢 段永平说得很直接:看图看线、做短线的人,在AI时代很危险。 你炒不过量化基金(原文好像说比不过“梁文峰”,哈哈哈)。 原话:“你就是"铁铁的韭菜"。” 当问及AI对他的投资决策影响时。 他说:AI没影响。 他的逻辑是看懂公司和生意,不是追热点、炒概念。 他关注AI的原因: “这波AI浪潮,至少要"掺和一下" 不要完全miss掉。 --- 下一篇讲讲他如何看待教育 视频播放地址见评论区
阿里的千问APP升级,目标非常明确:要在AI时代,再造一个像“支付宝”或“手机淘宝”那样的日活过亿“超级入口”。 目标是做一个真正“能办事”的超级入口,将 AI 能力深度集成应用在地图、外卖、订票、办公、学习、购物、健康等原有的业务板块中去。 1. 核心:把“全家桶”串起来 阿里最大的家底,就是淘宝(购物)、饿了么(外卖)、高德(地图)、飞猪(订票)等。 这些业务分别在不同的 App,现在,千问APP想当一个超级入口。你只需要“张嘴”下达指令(比如“帮我订明天去上海的机票,再叫个外卖”),把事情一次性办妥。 2. 目的:抢占“对话框” 以后的互联网,入口可能不再是搜索框或APP图标,一个“AI对话框”。谁占领了它,谁就掌握了用户。阿里必须抢占这个战略高地。 3. 关键:用“办事”喂养AI 光“聊天”的AI是不够聪明的。只有让你用它“办事”(购物、订餐),阿里才能得到最真实的用户数据。这些数据是最好的“养料”,能让千问AI越用越聪明,越聪明就越能干。 4. 防御:守住自家地盘 腾讯(元宝)、字节(豆包)、阿里(千问)相继下场,也是一场防御战。如果阿里自己不做,那用户就可能用别人的AI助手来“使唤”阿里的服务(比如用别家AI在淘宝下单),那样阿里就彻底“被动”了。 千问APP是阿里用全套的AI技术,把自己所有服务重新打包,试图打造的一个未来生活“总入口”。这是腾讯和字节所不具备的竞争优势,但是阿里产品的用户体验还跟其他两家有巨大差距,做 To C 市场不是他们所擅长的,并且没有足够优质的内容提供给 AI 学习和生成。 另外也实际体验了一下千问的产品,可能是文章内容质量的原因,算法上的优势并没有办法补全这部分的劣势,相同问题回答的质量不如元宝和豆包。 在已有参考资料下回答问题更优,更看重千问在自家业务上的整合,不然现在的千问看起来更像是半成品
我们来聊聊AI味儿: 第一种:先反差描述,然后急于解释。 因为模型的三观没有清洗好,所以大模型一直在扭转这种反常识 ,模型默认为是被迫要这样说。 然后就会接着说:老实说、本质上、其实等等词来进行转折。最后再补一个模型能够想到的案例,试图验证。 这个逻辑是非常缜密的。一定要符合:有效性与真理性。 把形式逻辑做到结果上,这些形式逻辑有很多种,还包括自问自答、定义阐述、案例说明。 第二种:表层示例 模型在组织过程中需要写出具体场景,还原它构思的完美的象,这个象又不能完全具象到刘阿姨、李大妈等等,智能通过比较大的门类层级。 看似都在推理中,实际与落地经验完全不是一回事,与执行差之千里,大体可以叫纸上谈兵。 第三种:虚空对比 在名词和动词的运用上,因为特别严谨,模型往往只能使用常用词,这在推理过程中,属于是进入了词的窄效应。 比如我们谈论哲学家,最优先选中的可能是亚里士多德和弗洛伊德,并不一定能落到维特根斯坦头上。 当你看到一篇文章经常出现你看到上一个词和下一个词在相关性上极高,属于有点文化就能想到的关联词时候,就很可能发现了模型的局限性。 第四种:语义与语用的连接。 模型的严禁程度不允许语义产生歧义,所以在语用上,一定会跟着进行约束,以达到表达的准确。 一旦进入一个需要解释的内容,必定会跟进解释,这两者中出现的连接词,往往包含了我们经常看到的:不是、是、而是、不止是、重要的是、本质上上、说白了。 语义是阐明这件事,语用是约束这件事所处的环境条件。 第五种:过度完美 模型的过度完美表现在,他要把一句话讲清楚,是非常有机器语言规律的,并非人性表达规律。 人的表达,往往拆开来这句话,是不容易形成完整语法的。即使符合语法,也会用词语规避掉完美,来符合自己的语言习惯。 未经雕琢的文字,可以是短句。比如“未经雕琢的文字”和“可以是短句”,就都是短句。 如果连起来写就会很别扭,这是我的习惯。 如果AI的习惯,会写:没有经过雕琢的文字也可以是由短句组成。 因为拆开,对于模型没有设定风格的时候,就不算一句话。 即使设定了风格,在推理过程中,也会偶然选中了必须选中的那个选项,也就偶尔还会冒出来AI味儿。 当然还有一些比如AI认为“讲”、“说”和“写”拥有不同的习惯。 当他识别文本为讲,那就是生活聊天风格,会比较多儿化音或者排比句或者很别扭的地方也放一个“了”做结尾; 识别为说,那就是单人叙述风格,带有大量说教的口吻,连词就会变多,解释也变多; 识别为写,那就是严谨到不能更严谨,长句不断。
Berryxia.AI
2个月前
☕️上周和安卓党朋友喝咖啡,他掏出AirPods Pro三代,我还笑他“买个苹果耳机插安卓,纯属浪费”。 结果他点了首歌,轻轻点头就接了电话。 我正愣着,他又摘下耳机——音乐自动暂停,手机扬声器直接响了。 更离谱的是,他下拉通知栏,清清楚楚显示着耳机和充电盒的剩余电量。 “你这安卓什么时候能认AirPods了?” 他把手机递过来,我才看见那个叫LibrePods的东西。 说真的,以前一直觉得“AirPods高级功能只认苹果”是铁律。 🤔直到今天才发现,原来这已经不是Apple的专利,只是没有细心研究,专门做了下功课在HackNews的开源项目-LibrePods。直接爆火! 它能让安卓甚至Linux设备,解锁苹果专属的几乎所有功能: ①降噪/通透模式自由切,戴没戴耳机自动检测,说话时还会主动降音量。 ②连多设备同时连、自定义长按动作这些细节都做满了。 ⚠️唯一要注意的是,像助听模式、多设备连接这些,得开一下Bluetooth DID hook。 目前测下来,AirPods Pro二代三代最适配,其他型号也能用上电量显示、耳塞检测这些基础的。 安卓要Root加Xposed模块,Linux也能用一部分。 现在再看朋友用安卓连AirPods,完全没了之前“暴殄天物”的感觉。 反而觉得,本该属于硬件的功能,就不该被生态圈死。 你觉得苹果该开放这些功能吗?这下只能促进AirPods的销量了! ✍🏻项目地址: