#AI播客

前阵子非常荣幸参加量子位的直播访谈,萌媛的问题准备得非常专业,我也把很多认知和反共识的东西一股脑抛了出来,现在文章在量子位主刊发表了,虽然不是头条但也希望它的阅读量超过头条哈。 我在这里抽取9条精华,万字长文的链接在评论区。 1. AI播客的核心并非“拟人”,而是高质量的“信息整理”,本质是 Content Remix,通过变换形式让人能够吸收信息。 2. 现在的AI阶段,对于专业用户,手动编辑功能依然至关重要,100%自动生成的质量还是不够 3. ListenHub 能把播客做好,来源于播客制作的行业论文研究,而非纯AI技术,这正是科技与人文的交汇处。 4. “使用时长”在AI时代是虚荣指标,AI产品应帮助用户尽快完成任务,Agent 应该看完成任务数而非完成任务所需时长 5. 一个产品最有价值的用户反馈来自前100个“陌生”付费用户,他们是有真需求,真愿意花钱,不是媒体,也不是投资人,也不是给你提需求的免费用户 6. AI时代的公司,需要“人人都是产品经理”,特别是工程师,需要成为直接为结果负责的人,以前那套产品经理指挥工程师的链路早就过时了 7. 网络效应在AI时代不成立,不看ROI地砸钱推用户量意义不大 8. 当前的语音助手都为“实时”牺牲了“智能”:很多语音助手为了追求即时响应,使用了更小、更快的模型,导致“智商不够”,无法进行深度或发散性思考,得不偿失。 9. AI应用公司要“顺势而为”,而非试图控制技术走向,要做和模型正交的事情,比如科技与人文的十字路口。 这应该是今年最后一篇访谈文章了,我想说的都已经说完了。
orange.ai
1个月前
最近播客是越来越火了,前几天 Stripe 的 CEO 在 x 上,贴了一张《金融时报》的报道,报道称,中国播客行业正在蓬勃发展,今年中国的播客听众总数将达到1.5亿,而五年前还不到70万。 今年可能是中国播客的爆发之年,我们话分三头来说。 一是入场名人越来越多,老罗第一期播客访谈李想,制作水平高超,话题真实深入,口碑直接爆炸。 二是 AI 播客发展迅猛,以 NotebookLM 和 ListenHub 为代表的 AI 播客工具,把播客的门槛降低到了会写字就行,极大地增加了播客供给。 三是小红书和B站这样的大平台开始推视频播客。视频播客已经是美国的主流形式,可小宇宙迟迟不支持,播客生态要做大,还是离不开大平台的推动。 每个对播客的理解都不一样,是因为每个人对播客的需求也有所不同。 老罗对访谈播客的理解,可能是通过精心的制作,深入的挖掘,展现嘉宾最真实的过往和心路历程,毕竟这是世界上最独特最珍贵的私域信息。 ListenHub 对 AI 播客的理解,是把人类制作起来重复枯燥的知识信息类播客全部替换成 AI,10倍地提升内容创作者的效率。 小红书对视频播客的理解,是朋友之间的闲聊里,灵挂乍现的时刻,饭桌闲聊,睡前谈心,户外散步。这和小红书最新的slogan「你的生活兴趣社区」不谋而合。 不管大家如何理解播客,播客生态的繁荣,都离不开三个要素:创作者、工具、平台。 只有三方共同发力,方能有播客的广阔天地。 在人们注意力越来越涣散的今天,播客提供了一种静下心来,放松的,舒适的环境。 听完播客,会有吸取知识的满足,倾听故事的情感共鸣,与轻松惬意的小小幸福感。
阑夕
3个月前
豆包新上线了AI播客,瑞士军刀功能再+1,目前支持PDF和网页链接的上传,总体来说,通过大模型的智能识别,豆包现在可以把任何内容转化成一条高度口语化的双人对话播客,属于趣味性和实用价值都很高的一次尝试。 熟悉大模型播客产品的人都知道,豆包这次对标的是谷歌NotebookLM——或者说是它最出圈的Audio Overviews功能——后者通过识别用户上传的文本、网页、视频,就可以转化成一条口语化且带有情绪表达的AI播客,深得用户喜爱。 Audio Overviews大约是在上个月开始支持中文的,但在中文播客市场砸出来的水花并没有想象中的大,一方面是众所周知的产品迁移成本,另一方面,中文播客市场体系化进度实在迟缓,用户习惯是高度分散的,这就导致了播客本身的适配场景很多,深究起来的播客用户以及潜在播客用户也不少,但商业化空间始终有限。 说回正题,我第一时间试了下豆包的AI播客,并分别投喂了两个不同的网站,一个是我写的刘强东前两天内部讲话的文章「刘强东的机巧」,另一个是B站UP主对Prompt, Agent, MCP等AI技术的科普文。 先说结论,在真正听完豆包生成的这两条AI播客之前,我对这项功能的完整程度预期并不高,原因在于,在这种复杂的任务上,目前很多主流大模型的做法还是「边吞边吐」,由此就会破坏内容输出的结构性。 但豆包已经可以做到在10分钟左右的播客篇幅里基于框架生成内容了,在「刘强东的机巧」生成AI播客的任务里,所有对话的前后呼应都很强,能听得出它是按照同一条逻辑线不断往下捋的,有点意外。 另外就是,豆包AI播客的拟人程度已经可以做到以假乱真了,这真的不是夸张,对话的流畅度、松弛感以及合时宜的抑扬顿挫,像我这种文字工作者,文章简单拿来改一改就能直接原地起个播客账号的程度。 那条硬核技术帖转播客的任务表现也相当亮眼,首次提及专业名词的时候,会贴心附上一段对这个概念的解释。整体的输出脉络,也都是建立在「我要深入浅出讲明白这条科普」这个最终目的上。 说人话,就是AI播客让内容的「可听性」变强了,哪怕注意力没有完全集中在耳朵上,这种通俗易懂的内容也变得更容易被消化。 播客——以及整个音频产业——一直以来的优势,是它不会完全参与到竞争用户注意力的零和博弈里去,大部分情况下,刷视频、聊微信、逛淘宝都是非此即彼的单一选项,但播客只占用一个耳朵,由此它能与很多不同的场景做适配。 豆包不是第一个推出这种功能的大模型,但它在应用场景上的成熟度是完全可以进到第一梯队的,不仅能把拗口的文字进行口语化改造再丝滑地表达出来,同时所有内容输出也都是基于原稿,不存在自己加戏的幻觉问题。 当然,作为新上线的功能,豆包AI播客还会经历一个漫长的迭代过程,比如目前它做不到像NotebookLM一样吃下视频内容,对话的声音、关键信息的提炼浓度,以及生成后的整体风格也都不是客制化的可选项,离用户可以随心所欲地深度使用它,尚且还有一段路要走。 但这并不妨碍我们从这个简单的小功能身上窥见AI在未来的使用场景,一切都是假以时日的问题。 虽然知道AI的技术一日千里,但每次实际体验的时候,那种奇妙感还是会忍不住涌上来。