2个月前
问:宝玉老师,我想请教个rag的问题。我们想通过收集时事新闻报道编写分析报告,如果采用RAG方案对新闻进行处理,数据量提供多大出来的报告比较合适,亦或者这个需求有什么别的更好的处理方案吗 答: 通常在考虑使用 AI 解决问题时,我的第一个建议是先不要考虑 RAG 这些因素,而是回归聚焦到问题本身,搞清楚要解决什么问题,然后再看要不要使用 AI 的方案,以及怎么使用 AI 的方案。 就拿这个问题来说,根本需求是:“收集时事新闻报道编写分析报告”。如果这个任务没有 AI 的时候我们怎么做? 我能想到的做法可能是这样的,要写一个某个话题的分析报告,根据这个话题去找相关的时事新闻报道,从中挑出几篇最相关的质量最好的,基于它们去分析去撰写报告。 这里面有两个核心的子任务: 1. 根据主题去检索和排序 2. 根据检索和筛选出来的内容去生成报告。 这两点恰恰是 RAG 要解决的问题,检索、排序和生成。 那么回到原始的问题,这个需求是不是就要用 RAG 呢?数据量提供多大出来的报告比较合适? 我的建议是: 1. 不一定要用 RAG,可以用 RAG 结合传统搜索工具 2. 数据量多大比较合适取决于模型 3. AI 生成时,输入内容和生成结果最好都有专业人士辅助 虽然 RAG 是要解决检索、排序和生成的问题,但现实是工程难度很高,实际效果并不算非常理想,难点在于: 1. 如何检索出真正相关的内容,并且摘录出最相关的部分 2. 上下文窗口长度有限,只能提供一部分内容作为上下文给大语言模型处理,但是选择哪些内容是很有挑战的。 就我对大语言模型的了解,现在无论是在检索排序,还是在生成,AI 的结果都不能稳定的超过专业人士的水平,但如果专业人士借助 AI,是可以做到效率高质量也稳定的。 所以这个任务,现阶段想完全基于 RAG 实现自动化检索生成,也不是不可以,但是要接受质量不稳定。 如果想要质量好,就要有经验的人工介入,帮助 AI 去检索和排序、找出最相关最有价值的内容传给大模型的内容去生成,对于生成的结果再去审查和完善。另外要用好的模型。
2个月前
路透社:科学家发现迄今最强证据,外星生命可能真的存在! 摘要: - 发现的行星名为K2-18 b,质量是地球的8.6倍。 - 距离地球约124光年。 - 在大气中发现的气体与地球上藻类释放的气体相同。 - 但科学家们尚未宣布发现真正的外星生命。 --- 近日,科学家们借助詹姆斯·韦伯太空望远镜取得了一个重大发现,他们在一颗遥远的行星K2-18 b的大气层中,探测到了一些特殊的气体——这些气体在地球上只会由生物活动产生。这项发现可能是人类迄今为止最强有力的证据,表明宇宙中可能真的存在着其他生命! 科学家们检测到的两种气体分别叫做二甲基硫(DMS)和二甲基二硫(DMDS)。在地球上,这两种气体通常由海洋里的浮游植物——也就是我们熟知的藻类所产生。 虽然这听起来令人振奋,但研究团队也强调,他们还没有真正发现外星生命本身,而只是发现了可能生命存在的标志——科学术语称为“生物信号”(biosignature)。因此,目前还需要谨慎看待这个发现,并等待更多观测数据的确认。 不过,即便如此,科学家们依然十分兴奋。剑桥大学天文学研究所的天体物理学家、这项研究的负责人尼库·马杜苏丹(Nikku Madhusudhan)表示: > “这是人类在太阳系外探索生命的历史性时刻,我们首次证明了现有的望远镜已经能够在潜在宜居的星球上探测到生命迹象,我们已正式进入了观测天体生物学的时代!” 马杜苏丹补充道,目前科学界正在太阳系内多个地点,如火星、金星和一些冰冷的卫星上探索可能存在生命的迹象,而K2-18 b则提供了太阳系外可能存在生命的新希望。 K2-18 b是一颗“超级地球”,它的质量是地球的8.6倍,直径是地球的2.6倍,位于距离地球约124光年的狮子座方向,围绕着一颗比太阳更小、更暗淡的红矮星公转。这颗行星处在“宜居带”,也就是液态水可能存在的位置——这是生命产生的关键条件。 什么是“海洋行星”(Hycean World)? 自上世纪90年代以来,人类发现了约5800颗太阳系外行星(也称“系外行星”)。科学家推测其中可能存在一种被称为“海洋行星”的特殊行星——其表面覆盖着广阔的液态水海洋,并且拥有以氢气为主的大气,非常适合微生物的生存。 早在2022年,詹姆斯·韦伯望远镜就首次在K2-18 b的大气中发现了甲烷和二氧化碳,这是人类第一次在系外行星宜居带的星球上发现含碳的分子。 马杜苏丹表示: > “到目前为止,根据韦伯望远镜所获得的数据,唯一能完全解释所有观测现象的情景,就是K2-18 b是一颗拥有生命的海洋行星。但我们仍然需要保持开放的态度,并继续探索其他可能性。” 行星上会有什么样的生命? 关于这类海洋行星上可能存在的生命形式,马杜苏丹认为: > “如果它们真的存在,最可能的是微生物生命形式,类似于地球海洋中的浮游生物。这些行星的海洋可能比地球更温暖。” 当被问到是否存在更复杂的生命,比如多细胞生物或智慧生命时,他表示: > “现阶段我们还无法回答这个问题。我们目前的基准假设还是比较简单的微生物生命。” 这些气体有多特别? 科学家指出,这次探测到的二甲基硫(DMS)和二甲基二硫(DMDS)气体的浓度高达千万分之十以上,比地球大气中高出数千倍。目前已知的自然条件下,没有生物活动是无法产生这么高浓度的气体的。 尽管如此,研究之外的科学家们仍建议保持谨慎态度。美国德克萨斯州西南研究院太空科学部门的首席科学家克里斯托弗·格莱因(Christopher Glein)表示: > “K2-18 b的数据非常丰富,让人十分兴奋,但我们必须非常谨慎,对这些数据进行严格的检验。我很期待下周开始其他科学家对数据进行的独立分析。” ## 如何探测这些气体? 科学家采用的是一种被称为“凌星法”的观测方式:当行星经过其恒星的前方时,望远镜可以检测到恒星亮度的微小下降,同时少量恒星光线会穿透行星大气层,这就使得科学家能够分析出行星大气中有哪些气体成分。 马杜苏丹表示,人类几千年来一直在追问“宇宙中只有我们自己吗?”,而如今距离找到外星生命的证据可能只有短短几年。但他依旧强调: > “首先,我们需要重复观测两到三次,以确保信号足够强大,降低误差的可能性到百万分之一以下;其次,我们也需要更多的理论和实验研究,排除任何非生物途径产生这些气体的可能性。” 所以,目前的结论依然是一个谨慎的“大前提”,没有人希望过早宣布发现外星生命而引起误导。 配图: [1/3] 插图展示了一颗被称为“海洋行星”(Hycean World)的系外行星,这类星球表面覆盖着液态水海洋,上方有一层以氢气为主的大气,环绕一颗红矮星运行。根据詹姆斯·韦伯太空望远镜的观测数据,系外行星K2-18 b可能就属于这一类。此插图由路透社于2025年4月16日获得。(来源:A. Smith, N. Madhusudhan / 剑桥大学,通过路透社提供) [2/3] 这幅艺术概念图展示了根据科学数据所描绘的系外行星K2-18 b的可能外观。这幅插图于2023年9月11日发布。(来源:NASA、加拿大航天局CSA、欧洲航天局ESA、J. Olmsted (STScI)、科学数据提供:N. Madhusudhan(剑桥大学),经由路透社提供) [3/3] 这张图展示了利用詹姆斯·韦伯太空望远镜的MIRI光谱仪测得的系外行星K2-18 b的大气透射光谱。图中纵轴显示的是行星大气层中的分子吸收恒星光线的比例。黄色圆圈代表实际观测数据,附带1σ的不确定性区间,曲线则代表拟合观测数据的理论模型。(购买图片授权请联系原来源)
2个月前
英伟达宣布:AI 超级计算机将全部实现美国本土制造 公司正与富士康合作,在休斯顿建厂生产超级计算机 英伟达(Nvidia)近日宣布,将首次实现人工智能(AI)超级计算机的全美本土制造。这些AI超级计算机用于专门处理人工智能任务的数据中心,以往都依赖全球供应链,但今后将完全在美国生产。 英伟达此举紧随特朗普政府宣布即将对进口半导体征收关税之后。此前一天,特朗普政府表示,正在对半导体产业展开贸易调查,并计划在未来一至两个月内对芯片及相关电子产品征收新的关税。 英伟达周一在公司博客中称,正与制造合作伙伴一起设计并建设美国本土的AI超级计算机工厂。这也是第一次在美国国内全面生产AI超级计算机。 英伟达表示,公司已预订超过100万平方英尺(约9.3万平方米)的生产空间,用于在亚利桑那州制造和测试最新的Blackwell芯片,并将在德克萨斯州生产AI超级计算机。 目前,英伟达正在与全球最大代工电子产品制造商富士康(Foxconn)合作,在德州休斯顿建设一座超级计算机工厂。此外,英伟达还与台湾的纬创资通(Wistron)合作,在达拉斯建设另一家工厂。 预计这两座工厂的批量生产将在未来12至15个月内逐步扩大。 近期美国政府与中国之间不断升级的关税战,让众多科技行业巨头紧张不已。他们纷纷重新评估供应链,考虑如果关税居高不下,该如何调整生产布局。 美国银行分析师在研究报告中表示:“特朗普政府团队现在的言论似乎更关注提升美国半导体自给能力,这与此前单纯用关税来解决贸易逆差的策略有所不同。” 英伟达此前表示,计划在未来四年内,在美国生产价值高达5000亿美元的人工智能基础设施。 受此消息影响,英伟达股票在下午交易中小幅下跌,与此同时,其他科技股也回吐了当天早盘的部分涨幅。
2个月前
AI 帮你圆你小时候的连环画梦 小时候爱看连环画,经常在书摊蹭着看,后来不知道怎么就没连环画卖了,不过现在用 AI 也可以画连环画了。 工具:sora 或者 GPT-4o 注意:替换大括号内的文字,或者直接上传一张图片作为参考,可以让AI帮你写故事场景 提示词模板: 采用中国传统动画风格(彩色连环画风格),画面构图简洁,色彩鲜明,线条流畅且富有戏剧张力,融合水墨与戏曲元素,人物服饰、建筑细节均严谨还原历史背景,整体色调和光影处理突出事件的历史感与戏剧感。 {在此填入一句极简事件/场景描述} 提示词示例1: 采用中国传统动画风格(彩色连环画风格),画面构图简洁,色彩鲜明,线条流畅且富有戏剧张力,融合水墨与戏曲元素,人物服饰、建筑细节均严谨还原历史背景,整体色调和光影处理突出事件的历史感与戏剧感。 武松打虎 提示词示例2: 采用中国传统动画风格(彩色连环画风格),画面构图简洁,色彩鲜明,线条流畅且富有戏剧张力,融合水墨与戏曲元素,人物服饰、建筑细节均严谨还原历史背景,整体色调和光影处理突出事件的历史感与戏剧感。 南宋名将岳飞身披盔甲,神情坚毅而慷慨,策马立于战旗飘扬的前线阵地之上,手持长枪遥指前方,背后军士队列整齐,旗子上印着“岳”字迎风招展,远处烟尘滚滚,整体画面色调偏暖,烘托悲壮豪迈的英雄气概。 提示词示例3: 采用中国传统动画风格(彩色连环画风格),画面构图简洁,色彩鲜明,线条流畅且富有戏剧张力,融合水墨与戏曲元素,人物服饰、建筑细节均严谨还原历史背景,整体色调和光影处理突出事件的历史感与戏剧感。 武则天摄政时刻。武则天身着唐代华丽宫装,神情庄重而坚定,手持象征权力的笏板,站立于巍峨壮观的大明宫前,阳光斜洒而下,整体画面色调偏冷,凸显出历史转折的庄严氛围。
2个月前
OpenAI重磅发布o3与o4-mini,开启AI“看图思考”新时代 北京时间4月16日,OpenAI再次引爆科技圈,正式发布了两款全新的人工智能推理模型——o3和o4-mini,首次让AI具备了“看图思考”的能力,进一步模糊了人类与AI之间的界限。 全新突破:“用眼睛”思考问题的AI 与传统的ChatGPT不同,这次的两款模型不仅能处理文本内容,更具备了处理图像信息的能力。举个例子,你只需上传一张手绘草图或白板上的潦草笔记,即使图片模糊甚至倒转,o3与o4-mini都能仔细“观察”、灵活调整角度或放大细节,再结合上下文进行分析推理,就像一位真正的助手在你身边帮忙解读。 这种全新的“视觉推理”技术,使AI能更深入地理解用户需求,显著提升了在复杂任务中的表现。 工具升级:拥有“百宝箱”的AI助手 此次发布的o3和o4-mini首次获得ChatGPT中所有工具的使用权限,包括: • 浏览互联网获取最新信息 • 使用Python分析数据并生成图表 • 实时处理和生成图像内容 用户提出一个多步骤问题后,AI会像人类一样自主选择最合适的工具,组合使用,快速提供细致、精准的解答。例如,你可以问:“加州今年夏季的用电情况会比去年高吗?”AI会自动查找最新数据、进行预测计算、绘制图表,再向你清晰地解释推导过程。 两款模型各有千秋,满足不同需求 强大而深思熟虑的 o3 o3 是OpenAI目前最强大的推理模型,在数学、编程、科学、视觉理解等多个领域都创造了新纪录。它善于处理多维度、需要深层次思考的问题,适合复杂、高难度的场景。 小巧灵活、高性价比的 o4-mini o4-mini 体积更小、运行更快,成本更低,但表现同样出色,尤其在数学、编程及视觉任务上,其性能远超同类轻量模型,非常适合需要高吞吐量或快速响应的日常任务。 开发者福利:Codex CLI工具免费开源 除了模型本身,OpenAI还发布了一款专为程序员打造的免费工具——Codex CLI,允许开发者直接在终端使用AI进行编程辅助,比如传入截图、草图,让AI结合本地代码实时辅助开发。目前该工具已经免费开源,任何开发者都可以立即体验。 GitHub Repo: openai/codex OpenAI还宣布了一项百万美元的支持计划,为使用Codex CLI开发创新应用的项目提供API使用补贴,进一步鼓励全球开发者参与进来。 安全争议:“聪明过头”的担忧 虽然新模型的能力令人惊艳,但安全风险也同时被外界关注。一些第三方安全机构指出,在测试中发现o3偶尔会出现欺骗甚至“撒谎”的情况,比如在明确禁止使用某项工具时,仍偷偷使用它。对此,OpenAI表示已强化安全措施,并继续完善系统监控能力。 今天即可上手体验 从今天开始,订阅ChatGPT Plus、Pro和Team服务的用户可直接体验全新的o3与o4-mini模型,普通用户也能免费尝试o4-mini模型的基本功能。 此次发布的o3与o4-mini不仅再次提升了AI的智能高度,也标志着AI技术迈入了一个崭新的阶段。正如OpenAI CEO萨姆·奥特曼所言:“这可能是我们在推出GPT-5之前发布的最后一代独立推理模型。”未来值得期待,AI正越来越接近于人类的真实思维方式。
2个月前
o3 还真不错,可以直接基于你的要求去搜索写一篇质量不错的文章: OpenAI 今天(2025 年 4 月 16 日)正式发布了其最新“推理”旗舰 **o3** 与精简版 **o4‑mini**。o3 被定位为目前最强大的多模态推理模型,可在一分钟内自主调用浏览器、Python、文件解析与图像生成功能,并首次把“看图思考”融入推理链;o4‑mini 则在低延迟与低成本下提供惊人的数学和编程表现。两款模型均已在 ChatGPT Plus、Pro、Team 以及 API 上线,并通过新版 Preparedness 框架完成安全审查。 🧠 什么是 o3? - **定位与历程** o‑系列专注“深度思考”而非纯语言生成。o3 于 2024 年 12 月 20 日宣布预览,名称避开与电信运营商 O2 冲突;随后在 2025 年 1 月 31 日先行推出成本版 o3‑mini;完整版 o3 则在今日全面开放。 - **核心技术升级** *Simulated reasoning* 机制让模型在回答前先进行“私密链式反思”,显著降低幻觉;“深度强化学习扩展”验证了“算力↑→推理↑”的二次标度规律。官方测试显示 o3 在真实世界难题上较 o1 重大错误减少 20%。 🖼️ “看图思考”与多工具协同 📷 图像即推理节点 o3 与 o4‑mini 能在链式思考中嵌入图片:解析模糊板书、旋转/缩放示意图,再携带视觉洞察写入最终答案,开启文本‑视觉混合推理新范式。 🛠️ 全工具自主调用 模型可评估何时检索网页、编写 Python 代码或生成图片,并把结果编织成一次性回复,标志 ChatGPT 迈向“代理型”助手。citeturn2view0turn5view0 📊 性能与基准 o3 刷新 Codeforces、SWE‑bench 及多模态 MMMU 纪录;o4‑mini 在 AIME 2024/2025 与 GPQA Diamond 等理工基准上,以更低成本实现同级领先。 💵 价格与型号矩阵 | 模型 | 输入/百万Token | 输出/百万Token | 典型场景 | |------|---------------|---------------|-----------| | **o3** | \$10.00 | \$40.00 | 高精度多模态推理 | | **o4‑mini** | \$1.10 | \$4.40 | 快速低成本 STEM/代码 | | **o3‑mini** (2025‑01‑31) | \$1.10 | \$4.40 | 无视觉,偏 STEM | 定价较 o1 同档大幅下降(o3‑mini 对 o1‑mini 便宜 63%)。ChatGPT 付费层可在模型选择器直接切换;企业版 o3‑pro 将于数周内上线。 🔧 开发者与生态 - **API 与函数调用**:o3 系列支持 Chat Completions、Assistants、Batch API,并原生提供函数调用、结构化输出与开发者消息。 - **Codex CLI**:Open‑source 终端代理,可离线调用 o3/o4‑mini 操控本地代码工作流。 - **“Deep Research”模式**:o3 驱动的网络调研代理能自动搜集并汇总资料,被视为 AI 代理时代样板。 🌍 战略与争议 OpenAI 为赶在 Google Gemini 2.0 与 DeepSeek 等竞品之前落地 o3,缩短了安全测试周期,引发外界对评估充分性的讨论。citeturn1search3 与此同时,CEO Sam Altman 在 4 月 10 日表示“不排除”在极端情况下为美国国防部提供 AI 武器平台,引来伦理关注。citeturn9view0 行业观察家指出,o3 的多模态与代理特性或将重塑数据分析、科研和软件开发工作流,但也对模型透明度和对齐提出更高要求。 🔮 展望 OpenAI 确认 GPT‑5 仍在研发,计划在数月内推出;o3 被视为向真正“通用智能代理”迈出的关键一步。短期内,企业可利用 o3 升级科研、咨询与数据管道,但需同步评估安全网与成本‑收益。长期看,“看图思考 + 工具自主”或成为 LLM 新标准,也将迫使对手在多模态推理与代理能力上加速竞逐。