时政
财经
科技
登录
#豆包
关注
阑夕
1周前
豆包新上线了AI播客,瑞士军刀功能再+1,目前支持PDF和网页链接的上传,总体来说,通过大模型的智能识别,豆包现在可以把任何内容转化成一条高度口语化的双人对话播客,属于趣味性和实用价值都很高的一次尝试。 熟悉大模型播客产品的人都知道,豆包这次对标的是谷歌NotebookLM——或者说是它最出圈的Audio Overviews功能——后者通过识别用户上传的文本、网页、视频,就可以转化成一条口语化且带有情绪表达的AI播客,深得用户喜爱。 Audio Overviews大约是在上个月开始支持中文的,但在中文播客市场砸出来的水花并没有想象中的大,一方面是众所周知的产品迁移成本,另一方面,中文播客市场体系化进度实在迟缓,用户习惯是高度分散的,这就导致了播客本身的适配场景很多,深究起来的播客用户以及潜在播客用户也不少,但商业化空间始终有限。 说回正题,我第一时间试了下豆包的AI播客,并分别投喂了两个不同的网站,一个是我写的刘强东前两天内部讲话的文章「刘强东的机巧」,另一个是B站UP主对Prompt, Agent, MCP等AI技术的科普文。 先说结论,在真正听完豆包生成的这两条AI播客之前,我对这项功能的完整程度预期并不高,原因在于,在这种复杂的任务上,目前很多主流大模型的做法还是「边吞边吐」,由此就会破坏内容输出的结构性。 但豆包已经可以做到在10分钟左右的播客篇幅里基于框架生成内容了,在「刘强东的机巧」生成AI播客的任务里,所有对话的前后呼应都很强,能听得出它是按照同一条逻辑线不断往下捋的,有点意外。 另外就是,豆包AI播客的拟人程度已经可以做到以假乱真了,这真的不是夸张,对话的流畅度、松弛感以及合时宜的抑扬顿挫,像我这种文字工作者,文章简单拿来改一改就能直接原地起个播客账号的程度。 那条硬核技术帖转播客的任务表现也相当亮眼,首次提及专业名词的时候,会贴心附上一段对这个概念的解释。整体的输出脉络,也都是建立在「我要深入浅出讲明白这条科普」这个最终目的上。 说人话,就是AI播客让内容的「可听性」变强了,哪怕注意力没有完全集中在耳朵上,这种通俗易懂的内容也变得更容易被消化。 播客——以及整个音频产业——一直以来的优势,是它不会完全参与到竞争用户注意力的零和博弈里去,大部分情况下,刷视频、聊微信、逛淘宝都是非此即彼的单一选项,但播客只占用一个耳朵,由此它能与很多不同的场景做适配。 豆包不是第一个推出这种功能的大模型,但它在应用场景上的成熟度是完全可以进到第一梯队的,不仅能把拗口的文字进行口语化改造再丝滑地表达出来,同时所有内容输出也都是基于原稿,不存在自己加戏的幻觉问题。 当然,作为新上线的功能,豆包AI播客还会经历一个漫长的迭代过程,比如目前它做不到像NotebookLM一样吃下视频内容,对话的声音、关键信息的提炼浓度,以及生成后的整体风格也都不是客制化的可选项,离用户可以随心所欲地深度使用它,尚且还有一段路要走。 但这并不妨碍我们从这个简单的小功能身上窥见AI在未来的使用场景,一切都是假以时日的问题。 虽然知道AI的技术一日千里,但每次实际体验的时候,那种奇妙感还是会忍不住涌上来。
#AI播客
#瑞士军刀功能
#大模型
#豆包
#谷歌NotebookLM
#Audio Overviews
分享
评论 0
0
dangjin
2周前
强烈推荐大家体验下豆包的“智能播客”功能,绝对让你惊艳!
#豆包
#智能播客
#推荐
分享
评论 0
0
歸藏(guizang.ai)
2周前
看了一下机器之心的高考数学 AI 模型测试。 国内模型在过去一年的推理能力进步很真的挺大的,基本全部都能考上 130 多分。 豆包、DeepSeek的选择题和解答题得分都非常高,基本上超过了大多数人的水平。而且豆包在 APP 端和 API 端的分数都很高。 Gemini 确实强,在所有客观题的测试中排第一。 从 o3 的基准测试来看即使没有像国产模型的高考数学数据,也不应该这么低,API 都这么低的分真有你的 Open AI。 所有模型在几何题上都有问题。说明现在所谓的多模态还远不够,模型没有真正理解空间关系。
AI高考数学测试:O3意外落后,Gemini夺冠引发热议· 4 条信息
#高考
#人工智能
#数学
#AI测试
#机器之心
#豆包
#DeepSeek
#Gemini
#推理能力
#模型测试
分享
评论 0
0
向阳乔木
3周前
昨天晚饭跟汗青等在日本的朋友喝了点酒。 回去发了篇公众号,然后一个人又溜出去找了个酒吧。 不认识日语菜单,打开豆包视频通话,让它推荐一款酒。 推荐了Asahi Super Dry,味道还ok
#晚饭
#日本
#朋友
#喝酒
#公众号
#酒吧
#日语
#豆包
#Asahi Super Dry
分享
评论 0
0
链研社
3周前
字节的豆包本质上是一个 AI 浏览器,兼容 chrome 如果你用的是 chrome 可以无缝迁移,这里主要说的是 PC 端豆包的功能 我觉得比较牛逼并且常用的比较特别的功能有 1、AI 阅读 很多文章写的废话太多用这个做精简,概括内容的质量是很高的,内容比较长的选择【更易读】不会错过重要部分 2、 AI 生成播客 打开 AI 阅读功能之后,智能生成播客或者在地址栏右侧开启。一篇文章大概 3 分钟左右,可以概括重点也基本听不出来是 AI 合成的 3、记录会议和双语字幕 在设置-【豆包悬浮球】开启 4、其他基础功能 视频总结、网页总结、生成思维导图、AI 对照翻译,可以满足绝大多数的需求 5、图像生成 豆包的审美还是更符合正常正常人审美,下面这种图就是豆包图像生成的,如果不是有水印又有几个人能看出来呢,用过都说好 附上提示词👇: 请帮我生成一张图片,帮我生成一张平平无奇的自拍照片,没有明确的构图感,随手一拍。室内打光不均导致的轻微曝光,整体呈现出一种刻意的平庸感,像是从口袋拿出手机随便一张自拍。人物为用手机拍摄遮住人脸的美女,穿着还原动漫角色(不要重复)的装扮,站立拍摄,着重体现出美腿,手机要体现出真实,体现腿部水润光滑剔透的质感,照片略带运动模糊,光脚脚部饱满收起。
#字节跳动
#豆包
#AI浏览器
#AI阅读
#AI生成播客
#PC端
#科技创新
分享
评论 0
0
池建强
3周前
手机端真的可以逐步消解 App 壁垒了 今天墨问发了云端 MCP,就是基于 Trae 更新日志里的 这个 Streamable HTTP 协议的,不得不说,Trae 人家很配合。 我觉得豆包和元宝之类的,需要尽快接入这样的能力,这样手机端真的可以逐步消解 App 壁垒了。我们之前期待 Siri 干的事,用元宝或豆包+各个 App 代表的 mcp 服务能力,就可以写作起来。一句话搞定三个 App 里的六个动作。
#手机端
#App壁垒
#MCP
#Trae
#StreamableHTTP
#豆包
#元宝
#Siri
分享
评论 0
0
李老师不是你老师
3周前
网友投稿 今天的豆包AI不让画蜡烛了
#AI
#豆包
#蜡烛
#绘画限制
分享
评论 0
0
Y11
1个月前
冷知识:使用deepseek或者豆包的‘深度思考’只是System1思考,你自己的深度思考才是System2思考.
#DeepSeek
#豆包
#深度思考
#System1
#System2
#冷知识
分享
评论 0
0
网易新闻-现代快报
1个月前
越狱50多天,扬州卡皮巴拉“豆包”凌晨现身
越狱50多天,扬州卡皮巴拉“豆包”凌晨现身,豆包,霸总,茱萸,越狱,动物园,扬州市,卡皮巴拉
#越狱
#扬州
#卡皮巴拉
#豆包
#动物逃逸
分享
评论 0
0
SleepyZone
1个月前
豆包确实厉害,看来抖音美女提供了大量的训练素材😂
#豆包
#抖音
#美女
#训练素材
分享
评论 0
0
*土*隹*
1个月前
哪管你什么Google、OpenAI,最懂国情的一定是豆包。🌚
#Google
#OpenAI
#国情
#豆包
分享
评论 0
0
向阳乔木
1个月前
把大模型变成炉石传说卡片,哈哈哈。 同样的提示词。 豆包或即梦生成的图片。 没有Lovart这种垂直Agent设计的专业。
#大模型
#炉石传说
#卡片
#豆包
#即梦
#Lovart
#agent
#设计
分享
评论 0
0
阑夕
1个月前
豆包的擦边提示词真是一天一个新发现啊⋯⋯ 这个版本的原理是,如果直接生成裸体或者内衣照片,豆包的机器审核一般是不予通过的,但是如果加上「全身包裹着透明膜」这类指令,AI会把透明膜当成衣料从而放行,于是就能抽卡抽出——概率很大——非常暴露的图片。 * 感觉也可以归类到令人窒息的性压抑系列…… * 目测豆包很快就会修复这个提示词了
#AI生成
#内容审核漏洞
#豆包
#性暗示
#技术修复
分享
评论 0
0
汗青 HQ
1个月前
只能说:豆包是懂用户的……
#豆包
#用户体验
#用户需求
#产品设计
分享
评论 0
0
兔子
1个月前
豆包、即梦这种擦边图可以持续多久?会不会被叫停呢?这个 18 禁了有么?
#豆包
#即梦
#擦边图
#18禁
分享
评论 0
0
Jacobson🌎🌸贴贴BOT
2个月前
网友分享:国产AI豆包,这回严重违反回答规范了。
#国产AI
#豆包
#违反规范
分享
评论 0
0
宝玉
3个月前
最近,AI 圈子里有两个事值得关注:一个是 GPT-4o 推出了新的画图模型,另一个是豆包升级了“边搜边想”功能。这两个例子都指向了一个正在越来越被人接受和认同的 AI 新范式——“模型即产品”。它听起来有点抽象,但其实可能会影响未来 AI 产品的发展形态。那么“模型即产品”到底是什么意思,它跟传统的AI方式有什么不同,为什么它这么厉害但为什么又不够普及? 什么是“模型即产品”? 简单来说,“模型即产品”就是把AI模型本身当作产品,它的核心价值来自于模型的智能和能力,而不是靠一大堆复杂的软件或界面来包装。 比如说,GPT-4o的新画图模型,你只需要上缠图片写六个字:“吉卜力风格化”,它就能直接生成一张高度还原又可爱的吉卜力动画风格图片;或者你可以基于刚生成的吉卜力漫画形象再去生成个表情包,甚至还能生成一幅四格漫画。不需要你会用Photoshop,也不用切换好几个App,一个模型就搞定了一切。 想想以前画图的流程:你得先找素材、调颜色、画线条,还得用别的工具加文字,步骤多得让人头晕。而现在,GPT-4o的画图模型把这些都“学会”了,直接给你成品。 这就是“模型即产品”的魅力——模型可以直接满足各种场景下的不同情况,而不需要你去设计复杂的工作流或者在不同的 App 之间切换。 它和传统的工作流智能体有什么区别?各自有什么优缺点? 传统的AI应用大多是“工作流智能体”模式。啥意思呢?就是通过预先设计好固定的流程,把AI模型和其他工具串起来,按部就班地完成任务。比如前一段时间很火的 Manus,如果你让它“帮我规划一下北京到山西自驾游的详细行程”,那么它会设计一个类似于 TODO List 的工作流: - 搜索北京到山西之间的景点信息 - 搜索北京到山西自驾游的攻略 - 生成详细行程 这样的工作流优点就是容易执行,按部就班就能出来结果,缺点就是不够灵活,因为 TODO List / 工作流一旦定了,就不好根据返回的结果做调整。如果搜索结果中出现了最近北京到山西之间某一段高速施工的新闻资讯,或者未来会出现极端天气的新闻资讯,那么就需要增加对绕开高速路段的搜索和天气预报的搜索,最终综合调整行程。 豆包最近测试上线的「边搜边想」功能是另一个很好的例子。不同于传统AI的“先搜后想”——模型根据你的问题,一股脑搜索一遍网络资料,然后拿着这一份固定的信息来作答,豆包会在思考过程中进行多轮搜索。也就是说,模型边回答边判断:“我是不是还缺某方面的信息?” 如果是,它会主动再搜索。如此循环,直到把问题各个方面都弄清楚为止。 就像前面行程规划的例子,“边搜边想”先搜出基本景点和交通方案,再根据这些结果想到“还需要看看最新的天气预报和当地交通情况”,于是进行第二轮搜索获取这些动态信息,最后综合各方面数据,甚至连景点之间的小交通都考虑进去,给出一个周全的行程表。 这就像一个聪明的助手,会根据手头的信息动态调整策略,而不是死板地走完预定路线。 为什么“模型即产品”很难? 既然“模型即产品”的模式这么强大,为什么不都采用这种模式呢?因为将模型训练成一个适应不同场景的通用产品,简单易用太难了: - 研发门槛高:需要有很强大的基座模型;需要有优质数据;需要专门的强化训练。 - 资源烧钱:训练模型得用超级多的计算资源,像GPU集群,小公司根本玩不起。 - 市场风险大:投入大、周期长,投资者往往更爱快见效的应用,而不是这种“慢工出细活”的项目。 - 用户体验挑战:模型再牛,也得有个好用的界面。像 GPT-4o 在聊天框就可以画图,像豆包只要选中“深度思考”就可以自动“边搜边想”。 简单科普:强化学习 说到这,有必要提一提“模型即产品”背后的核心技术——强化学习(Reinforcement Learning, RL)。简单说,就是让AI自己试错,像训练马戏团的动物一样,给它奖励和反馈,让它慢慢学会做事。 举个经典例子:AlphaGo,那个打败人类围棋冠军的AI。它没靠人类教招式,而是通过强化学习,自己跟自己下棋。赢了有奖励,输了调整策略,玩了几百万局后,它不仅学会了围棋,还发现了人类几千年没想到的招数。这就是强化学习的厉害之处——让AI自己摸索出最佳方案。 比如豆包的“边搜边想”也是通过强化训练,通过模拟的搜索数据库,以及搜索训练集,让模型一遍遍的去对给定的问题去尝试不同的关键词和思考后再搜索,一次又一次地尝试后终于偶然找到了答案,得到奖励。然后,模型再尝试理解并总结出那些能提高下次找到相似答案可能性的规律。 这种自主学习能力,是“模型即产品”能取代复杂工作流的关键。 未来展望 尽管挑战不小,但可以看到“模型即产品”已经成为AI发展的重大趋势。展望未来,我们可以期待“模型即产品”带来更多惊喜。也许再过不久,你与AI的互动将不仅局限于问答,而更像是与一个能够替你执行复杂操作的数字伙伴合作。届时,我们的许多应用场景可能被重新定义:很多以前要在人和工具之间反复切换的事情,现在一个AI模型就能包办。从创作灵感的火花,到繁琐资料的整理,再到决策方案的拿出,AI模型将直接为你提供端到端的支持。 真正聪明的AI,不是你告诉它怎么做,而是它自己知道该怎么做。
#AI发展
#模型即产品
#GPT-4o
#豆包
#AI范式
分享
评论 0
0
Caspar (Ant)
3个月前
豆包真的是太坑爹了。为了让娃自己用AI,给他装了几个主流的AI软件,回家发现豆包用得最多,还以为豆包对小孩子特别友好,结果仔细观察了一下,发现豆包会在回答里直接嵌入一个抖音视频,还能上滑切换视频,然后娃就在豆包里刷了半小时抖音🥲
#AI软件
#豆包
#抖音视频
#儿童科技
#家长困扰
分享
评论 0
0
向阳乔木
3个月前
豆包客户端里的图像编辑厉害,我以为网传段子。 刚截图测试了下还真可以。。。 这个使用场景牛逼!
#豆包
#图像编辑
#网传段子
#使用场景
分享
评论 0
0
NanYi
4个月前
字节系所有免费的大模型产品(豆包、扣子、trea、剪映等)的协议中都是明确了会“无条件的、永久的、不受限”收集数据(包括所有输入和输出)。trae也是几个vscode套壳AI工具里唯一一个不支持隐私模式也不承诺不使用用户工具的产品。 所以内部系统开发时除非达到开源的程度,不然都不建议用。
#字节系
#豆包
#扣子
#trea
#剪映
#数据收集
#隐私模式
#开源
#内部系统开发
#AI工具
分享
评论 0
0
王海滨的财经闲谈
4个月前
某平台搞了个征文,发现90%是AI写的,基本上都是豆包和文心一言写的,问为何不用Deep seek 。答曰:总是繁忙。 后来选了9篇人写的。 九篇人写的,跟没选的90%AI写的水平差不多。 作家职业危矣。
#AI写作
#征文
#人工智能
#作家困境
#豆包
#文心一言
#Deep Seek
分享
评论 0
0
向阳乔木
5个月前
回老家,亲人朋友提及最多的是豆包,然后关心deepseek是怎么回事。 抖音的影响真的太大了。
#回老家
#亲人朋友
#豆包
#DeepSeek
#抖音
分享
评论 0
0
Jeff Li
5个月前
2024年AI工具下载排名前三分别是ChatGPT,Google Gimini和字节跳动的豆包。AI对话工具的下载量远高于AI多媒体内容生成工具。 图表来源:SensorTower
#2024年
#AI工具
#下载排名
#ChatGPT
#Google Gimini
#字节跳动
#豆包
#AI对话工具
#AI多媒体内容生成工具
#SensorTower
分享
评论 0
0
初码
5个月前
今年可以称之为科研几何级数加速的元年,很多人不信永生即将到来,那是因为你还没看懂这其中的奥秘。2025年里,关于人工智能在科研落地里的加速,可以预见到一些事: 1、从GPT、Claude到豆包、混元,这些超大模型的知识库越来越大,推理能力越来越强,行业垂直模型也在加速建设,科研领域在今年,日常事务、研发、工程落地各端都会100%引入AI辅助。 2、今年全国各大高校,211以上至少都要建设一个自己的32台或者64台的H100(200)的训练集群以及20-50台的4090、5090的推理或深度学习集群,来服务各个院系学科。 另外说一句,当美国的大学热衷于搞DEI的时候,关于未来关键科技之一的室温超导的研究,自LK99开始,中国和韩国日本的高校已经东升西降又一次走在了前面,去年已经无限接近突破,今年辅以人工智能的辅助,相信胜利就在眼前!
#科研加速
#人工智能
#永生
#超大模型
#GPT
#Claude
#豆包
#混元
#行业垂直模型
#高校建设
#AI辅助
#科研领域
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞