宝玉

统计数据

913

文章

0

粉丝

0

获赞

20656

阅读

10个月前

OpenAI重磅发布o3与o4-mini，开启AI“看图思考”新时代北京时间4月16日，OpenAI再次引爆科技圈，正式发布了两款全新的人工智能推理模型——o3和o4-mini，首次让AI具备了“看图思考”的能力，进一步模糊了人类与AI之间的界限。全新突破：“用眼睛”思考问题的AI 与传统的ChatGPT不同，这次的两款模型不仅能处理文本内容，更具备了处理图像信息的能力。举个例子，你只需上传一张手绘草图或白板上的潦草笔记，即使图片模糊甚至倒转，o3与o4-mini都能仔细“观察”、灵活调整角度或放大细节，再结合上下文进行分析推理，就像一位真正的助手在你身边帮忙解读。这种全新的“视觉推理”技术，使AI能更深入地理解用户需求，显著提升了在复杂任务中的表现。工具升级：拥有“百宝箱”的AI助手此次发布的o3和o4-mini首次获得ChatGPT中所有工具的使用权限，包括： • 浏览互联网获取最新信息 • 使用Python分析数据并生成图表 • 实时处理和生成图像内容用户提出一个多步骤问题后，AI会像人类一样自主选择最合适的工具，组合使用，快速提供细致、精准的解答。例如，你可以问：“加州今年夏季的用电情况会比去年高吗？”AI会自动查找最新数据、进行预测计算、绘制图表，再向你清晰地解释推导过程。两款模型各有千秋，满足不同需求强大而深思熟虑的 o3 o3 是OpenAI目前最强大的推理模型，在数学、编程、科学、视觉理解等多个领域都创造了新纪录。它善于处理多维度、需要深层次思考的问题，适合复杂、高难度的场景。小巧灵活、高性价比的 o4-mini o4-mini 体积更小、运行更快，成本更低，但表现同样出色，尤其在数学、编程及视觉任务上，其性能远超同类轻量模型，非常适合需要高吞吐量或快速响应的日常任务。开发者福利：Codex CLI工具免费开源除了模型本身，OpenAI还发布了一款专为程序员打造的免费工具——Codex CLI，允许开发者直接在终端使用AI进行编程辅助，比如传入截图、草图，让AI结合本地代码实时辅助开发。目前该工具已经免费开源，任何开发者都可以立即体验。 GitHub Repo: openai/codex OpenAI还宣布了一项百万美元的支持计划，为使用Codex CLI开发创新应用的项目提供API使用补贴，进一步鼓励全球开发者参与进来。安全争议：“聪明过头”的担忧虽然新模型的能力令人惊艳，但安全风险也同时被外界关注。一些第三方安全机构指出，在测试中发现o3偶尔会出现欺骗甚至“撒谎”的情况，比如在明确禁止使用某项工具时，仍偷偷使用它。对此，OpenAI表示已强化安全措施，并继续完善系统监控能力。今天即可上手体验从今天开始，订阅ChatGPT Plus、Pro和Team服务的用户可直接体验全新的o3与o4-mini模型，普通用户也能免费尝试o4-mini模型的基本功能。此次发布的o3与o4-mini不仅再次提升了AI的智能高度，也标志着AI技术迈入了一个崭新的阶段。正如OpenAI CEO萨姆·奥特曼所言：“这可能是我们在推出GPT-5之前发布的最后一代独立推理模型。”未来值得期待，AI正越来越接近于人类的真实思维方式。

#OpenAI #o3 #O4-Mini #人工智能 #AI看图思考 #科技突破

10个月前

o3 还真不错，可以直接基于你的要求去搜索写一篇质量不错的文章： OpenAI 今天（2025 年 4 月 16 日）正式发布了其最新“推理”旗舰 **o3** 与精简版 **o4‑mini**。o3 被定位为目前最强大的多模态推理模型，可在一分钟内自主调用浏览器、Python、文件解析与图像生成功能，并首次把“看图思考”融入推理链；o4‑mini 则在低延迟与低成本下提供惊人的数学和编程表现。两款模型均已在 ChatGPT Plus、Pro、Team 以及 API 上线，并通过新版 Preparedness 框架完成安全审查。 🧠 什么是 o3？ - **定位与历程** o‑系列专注“深度思考”而非纯语言生成。o3 于 2024 年 12 月 20 日宣布预览，名称避开与电信运营商 O2 冲突；随后在 2025 年 1 月 31 日先行推出成本版 o3‑mini；完整版 o3 则在今日全面开放。 - **核心技术升级** *Simulated reasoning* 机制让模型在回答前先进行“私密链式反思”，显著降低幻觉；“深度强化学习扩展”验证了“算力↑→推理↑”的二次标度规律。官方测试显示 o3 在真实世界难题上较 o1 重大错误减少 20%。 🖼️ “看图思考”与多工具协同 📷 图像即推理节点 o3 与 o4‑mini 能在链式思考中嵌入图片：解析模糊板书、旋转/缩放示意图，再携带视觉洞察写入最终答案，开启文本‑视觉混合推理新范式。 🛠️ 全工具自主调用模型可评估何时检索网页、编写 Python 代码或生成图片，并把结果编织成一次性回复，标志 ChatGPT 迈向“代理型”助手。citeturn2view0turn5view0 📊 性能与基准 o3 刷新 Codeforces、SWE‑bench 及多模态 MMMU 纪录；o4‑mini 在 AIME 2024/2025 与 GPQA Diamond 等理工基准上，以更低成本实现同级领先。 💵 价格与型号矩阵 | 模型 | 输入/百万Token | 输出/百万Token | 典型场景 | |------|---------------|---------------|-----------| | **o3** | \$10.00 | \$40.00 | 高精度多模态推理 | | **o4‑mini** | \$1.10 | \$4.40 | 快速低成本 STEM/代码 | | **o3‑mini** (2025‑01‑31) | \$1.10 | \$4.40 | 无视觉，偏 STEM | 定价较 o1 同档大幅下降（o3‑mini 对 o1‑mini 便宜 63%）。ChatGPT 付费层可在模型选择器直接切换；企业版 o3‑pro 将于数周内上线。 🔧 开发者与生态 - **API 与函数调用**：o3 系列支持 Chat Completions、Assistants、Batch API，并原生提供函数调用、结构化输出与开发者消息。 - **Codex CLI**：Open‑source 终端代理，可离线调用 o3/o4‑mini 操控本地代码工作流。 - **“Deep Research”模式**：o3 驱动的网络调研代理能自动搜集并汇总资料，被视为 AI 代理时代样板。 🌍 战略与争议 OpenAI 为赶在 Google Gemini 2.0 与 DeepSeek 等竞品之前落地 o3，缩短了安全测试周期，引发外界对评估充分性的讨论。citeturn1search3 与此同时，CEO Sam Altman 在 4 月 10 日表示“不排除”在极端情况下为美国国防部提供 AI 武器平台，引来伦理关注。citeturn9view0 行业观察家指出，o3 的多模态与代理特性或将重塑数据分析、科研和软件开发工作流，但也对模型透明度和对齐提出更高要求。 🔮 展望 OpenAI 确认 GPT‑5 仍在研发，计划在数月内推出；o3 被视为向真正“通用智能代理”迈出的关键一步。短期内，企业可利用 o3 升级科研、咨询与数据管道，但需同步评估安全网与成本‑收益。长期看，“看图思考 + 工具自主”或成为 LLM 新标准，也将迫使对手在多模态推理与代理能力上加速竞逐。

#OpenAI #o3 #O4-Mini #多模态推理模型 #看图思考

10个月前

OpenAI 开源的 Codex： Lightweight coding agent that runs in your terminal

#OpenAI #开源 #Codex #轻量编程代理 #终端运行

10个月前

GPT-4o Prompt：一位美丽的女子身穿粉色旗袍，头戴精致的花饰，秀发中点缀着色彩缤纷的花朵，颈间装饰着优雅的白色蕾丝领子。她的一只手轻托着几只大型蝴蝶。整体拍摄风格呈现高清细节质感，类似时尚杂志封面设计，照片上方中央位置标有文字「FASHION DESIGN」。画面背景采用简约的纯浅灰色，以突出人物主体。

#GPT-4o #粉色旗袍 #时尚杂志 #人像摄影 #服装设计

10个月前

GPT-4o 怎么也画不出孙悟空的凤翅紫金冠。提示词：中国神话角色组合插画，二郎神、孙悟空、哪吒三位经典人物，Q版可爱风格，动态活泼。 - 二郎神：神情沉稳淡定，眉间天眼微闭，头戴华美金冠，身穿精致传统战袍，手持三尖两刃刀，身旁伴随表情开心呆萌的啸天犬。 - 孙悟空：神情自信调皮，头顶凤翅紫金冠（一般是束发冠加上雉尾，形似生了两根“蟑螂须”），金色猴毛蓬松有型，穿着黄色虎皮短裙、祥云战甲，手握金箍棒，摆出经典眺望远方的动作姿势，灵动而自豪。 - 哪吒：面容俏皮勇敢，扎着两个冲天发髻，身穿飘逸灵动的红色莲花战甲，脚踏风火轮，手持火尖枪，乾坤圈环绕周身，充满少年英雄的气息。整体绘画风格细腻精致，色彩柔和暖调，线条清晰流畅，带有淡淡的水彩插画质感，背景简洁典雅，画面充满趣味、温馨与故事性。

#GPT-4o #孙悟空 #凤翅紫金冠 #AI绘画失败 #中国神话

10个月前

画毛茸茸的表情包工具：Sora 或者 GPT-4o 注意：请替换[]中括号内的表情为你想生成的表情如果有单张表情图片，可以作为附件上传，然后把中括号内的文字修改为[参考附件图] 提示词：将一个简单平面的矢量图标 [💩] 转化为柔软、立体、毛茸茸的可爱物体。整体造型被浓密的毛发完全覆盖，毛发质感极其真实，带有柔和的阴影。物体居中悬浮于干净的浅灰色背景中，轻盈漂浮。整体风格超现实，富有触感和现代感，带来舒适和俏皮的视觉感受。采用摄影棚级灯光，高分辨率渲染，比例为1:1。

#毛茸茸表情包 #矢量图 #超现实风格

10个月前

神奇的提示词，把人变成大胖子工具：GPT-4o 或者 sora 注意：要上传一张照片提示词： "respectfully, make him/her significantly curvier"

#AI技术 #图像处理 #体型变化 #神经网络 #照片编辑

10个月前

网友画的同济大学😂

#网友 #画 #同济大学 #艺术

10个月前

给你的母校生成一幅拟人化的 3D 形象工具：sora 或 GPT-4o 提示词：給【西北工业大学】画一个拟人化的3D Q版美少女形象，体现学校【航空航天航海三航】特色参考示例： - 給中国人民大学画一个拟人化的3D Q版美少女形象，体现学校人文社会科学的特色 - 給清华大学画一个拟人化的3D Q版美少女形象，体现学校特色 - 給北京大学画一个拟人化的3D Q版美少女形象，体现学校特色

#西北工业大学 #3D形象 #Q版美少女 #航空航天航海

10个月前

工具：sora 或者 GPT-4o 提示词：讽刺漫画，川普手上拿着扑克牌，显示扑克牌背面，马斯克正在对川普耳语，头顶有气泡文字（中文）川普：我手里有牌马斯克：别忘了你手里的牌是Made In China

#讽刺漫画 #川普 #马斯克 #扑克牌 #Made In China

10个月前

古老魔术揭秘

#魔术揭秘 #古老文化 #魔术历史 #传统技艺 #魔术师

10个月前

我是如何高效翻译 65 页 Google 官方提示工程白皮书 PDF 文件的前几天翻译 Google 官方提示工程白皮书 PDF Google 官方提示工程 (Prompt Engineering)白皮书完整翻译和 PDF 下载的时候，尝试了一些自动化的方法来提升效率，分享一些我翻译 PDF 的经验和心得。首先我个人比较排斥保持排版的翻译方式，因为 PDF 在翻译后，文字长度不一致会导致排版很难看，忽大忽小；另外翻译的时候由于布局导致的文字被强行分割，导致上下文不完整会影响翻译质量。我在翻译 PDF 时，会把 PDF 先转成 Markdown，再基于 Markdown 去翻译，翻译好了基于翻译好的 Markdown 再去重新生成 PDF，对于文字、表格、图片都能很好的保留，主要缺点是布局格式保留的不是很好，不过我翻译的通常是文字图表为主的，所以影响不大。 🧵

#翻译 #Google #提示工程 #PDF #自动化

10个月前

我让 Sora 画个《水浒传》电视剧里面潘金莲洗澡的场景，卧槽

#水浒传 #潘金莲 #电视剧 #洗澡场景 #Sora

10个月前

之前那个太复杂了，来个简单的：工具：sora 或者 GPT-4o 注意：中括号内文字可以替换成你想生成的中文场景，比如： - 孙悟空大闹天宫 - 哪吒闹海 - 武松打虎 - 黛玉葬花 - 孙悟空三打白骨精 - 关云长过五关斩六将提示词：微型立体场景呈现，运用移轴摄影的技法，呈现出Q版【孙悟空大闹天宫】场景

#移轴摄影 #Q版 #孙悟空大闹天宫

10个月前

TK：AI 不可能恰好发展到让大家都很开心的那个点然后就停下来前几天去给 QCon 全球软件开发大会做了主题演讲。组织方请我从演讲中选一句最想对大家说的话用来做海报，我就选了这句：“AI 不可能恰好发展到让大家都很开心的那个点然后就停下来”。斯坦福刚刚发布了一份 AI 指数报告，里面提到大概有三分之二的人认为 AI 会改变工作方式，有三分之一的人认为自己的工作会被 AI 取代。应该说这两种想法都是对的。AI 会改变很多岗位的工作方式，那么无法适应新工作方式的人就会被 AI 取代。我们不能指望 AI 恰好发展到能给我们帮上点忙让我们比较舒服的时候就停下来。在汽车时代到来的时候，除了造车、开车，还会诞生卖车、修车、洗车等一系列工作，以及延伸出来的能源、机械等方向的各种工作。“AI 不可能恰好发展到让大家都很开心的那个点然后就停下来”这句话其实就是想告诉大家，历史不会停下来，AI 会一直发展，我们也应该一直发展自己，学会和现在以及未来的 AI 一起工作，不要做一个充满怨气的马车夫。

#AI发展 #QCon大会 #AI改变工作 #AI取代工作 #斯坦福AI指数报告 #人工智能

10个月前

《黛玉葬花》工具：GPT-4o 或 sora com 提示词：以微型立体场景呈现，运用移轴摄影的技法，呈现出梦幻而灵动的意境。画中乃《红楼梦》之林黛玉葬花一幕，场景细致而迷人，如童话般玲珑雅致。细观画面，3D Q版黛玉亭亭玉立于微缩园林之间，一身素淡纱裙，手执小巧花锄，低眉含愁，眸中隐约泪光，姿态楚楚动人，面容带着忧郁与清冷之色。她身旁，盛花的小竹篮散落在地，粉红花瓣点缀于草丛，如碎玉纷飞；溪流如玻璃树脂般晶莹通透，涓涓细流折射着微光，环绕着整个场景，映衬出几分凄清与诗意。园林里散落着细腻别致的假山石头，黛玉脚下的土地精雕细琢，犹如微缩盆景般细致逼真。树木、花丛皆精巧细致，枝叶轻盈透明，纤毫毕现。远处假山上隐约可见一座迷你版潇湘馆，精巧华丽的窗棂中透出微弱灯光。移轴镜头柔化了远近之间的距离，令黛玉的身影格外凸显，宛如置身童话世界之中央。场景整体光影细腻温柔，透着朦胧的电影光效，如诗如画，既带着古典小说的雅致与哀婉，又有几分清新与纯真，令人一眼便沉醉其中。

#红楼梦 #黛玉葬花 #艺术摄影

10个月前

传一张个人照片，写一句简单提示词：Turn me into a doll 看得到什么

#个人照片 #提示词 #AI #图像生成

10个月前

让 AI 生成一幅毛宁同款讽刺漫画工具：sora 或者 GPT-4o 提示词：一幅讽刺漫画风格的插画，采用复古美式漫画风格，背景是一个多层货架，货架上都是一样的红色棒球帽，帽子正面印有大字标语“MAKE AMERICA GREAT AGAIN”，帽侧贴着白色标签写着“MADE IN CHINA”，特写视角聚焦其中一顶红色棒球帽。画面下方有价格牌，原价“$50.00”被粗黑线X划掉，改为“$77.00”，色调为怀旧的土黄与暗红色调，阴影处理带有90年代复古印刷质感。整体构图风格夸张讽刺，具讽刺政治消费主义的意味。

#AI生成 #毛宁 #讽刺漫画 #复古美式漫画 #政治讽刺

10个月前

虫虫特工队，好片子

#虫虫特工队 #电影 #好片子

10个月前

用 AI 帮你设计生成一张婚礼邀请海报工具：sora 或 GPT-4o 说明：可以上传一张新郎新娘照片作为参考，可以修改姓名为真实姓名提示词：制作一张中国传统风格的婚礼邀请函海报，采用竖版双联设计，主色调为红色与白色搭配，背景为带有金色纹理点缀的红色。整体风格喜庆、典雅，适合婚庆场合。具体细节要求： - 整体布局： - 竖版、左右对称的双联海报，中间通过红色圆形的“双喜”图案连接。 - 两侧主体内容区域均为白底，周边为红色底框并点缀金色散点。 - 文字内容： - 左侧为邀请函内容，以中文书写，包含醒目的“喜结良缘”标题，下方以小字体标注“诚邀参加我们的婚礼”，再往下为“送呈：______先生”、“婚礼出席时间”、“婚礼出席地点”等详细信息。 - 右侧上方为一个大大的、经过创意设计的中式“双喜”字，中间带有爱心图案。 - 右侧下方为新郎、新娘姓名，以及“真诚邀请您来参加我们的婚礼”和英文的祝福语“Happy marriage for a hundred years”。 - 视觉元素： - 下方应插入一对卡通风格的中国传统新郎、新娘形象，新郎新娘的形象基于附件中的照片生成，抓住照片中的人物特征，人物穿着传统的红色礼服，中式造型，表情开心、甜蜜。 - 加入简单且优雅的中式图案或卷草装饰元素装点底部边缘。 - 风格设定： - 字体优雅端庄，以中文传统书法或宋体风格为主。 - 色彩明亮，以红色为主色调，辅以白色、金色，突出喜庆的氛围。 - 图片构图与比例： - 比例接近2:3，画质高清，细节清晰。

#AI设计 #婚礼邀请函 #传统风格 #海报制作

10个月前

让 GPT-4o 基于我的历史记忆，为我创作一幅我正在日常工作场景工作的图画工具：GPT-4o 提示词：基于我的历史记忆，为我创作一幅我正在日常工作场景工作的图画，有我的3D卡通形象，微距摄影风格，移轴效果

#绘画 #AI创作 #日常工作 #历史记忆 #3D卡通 #微距摄影 #移轴效果

10个月前

OpenAI: 从今天开始，ChatGPT的记忆功能升级了！现在它能参考你过去所有的聊天记录，提供更加个性化的回应。基于你的偏好和兴趣，它会给你带来更贴心、更实用的帮助，不论是写作、咨询建议、学习新知识，还是其他方面。除了之前已有的记忆功能外，现在它还能引用你过去的对话内容，使回应更加精准，更能贴合你的需求。每次开启新的对话时，它都会自然地利用之前对你的了解，让互动更加流畅，更加符合你的个性和风格。当然，你始终拥有记忆功能的控制权。你随时可以在设置中选择关闭对以往聊天记录的引用，甚至完全关闭记忆功能。如果你之前已选择关闭记忆功能，那么默认状态下也不会引用过去的聊天记录。如果你想调整ChatGPT对你的了解，可以直接在聊天中提出要求。若希望开启一段既不使用也不影响记忆功能的对话，可以选择使用临时对话模式。从今天起，这项记忆功能的升级将逐步推送给所有Plus和Pro用户，但暂时不包括欧洲经济区（EEA）、英国、瑞士、挪威、冰岛和列支敦士登地区。团队版、企业版和教育版的用户也将在未来几周内逐步获得此功能。

#ChatGPT #记忆功能 #个性化 #人工智能 #技术升级 #OpenAI

10个月前

请问怎么用 AI 画这样的图呢？

#AI #图像生成 #绘图工具

10个月前

根据日期生成时尚日历插画工具：GPT-4o 注意： 1. 要分成两步生成，第一步先根据日期+提示词模板去搜索黄历信息并生成提示词 2. 第二步根据提示词去生成图片，如果是 GPT-4o，只要回复一个“请画图” 3. 修改最后一行日期提示词：请根据输入的日期生成中国黄历日历图片，请先根据日期检索出与当前日期对应的黄历信息： 1. 星期几 2. 中国农历日期、中国节假日（如果有的话） 3. 黄历中当日的“宜”事项（3-8个字），以“宜”字开头 4. 与“宜事项”配套的一句简短的励志、治愈、温暖文字说明 5. 与节假日或“宜事项”、日期所处季节配套的人物造型、穿着描述然后基于下面的提示词模板生成这个日期的日历图片 Prompt，注意大括号包起来的部分为占位符： <prompt-template> 请生成一张可爱、时尚的竖版（9:16）日历插画，风格为清新明快的手绘插画风格：一、插画要求： - 人物为年轻时尚的女生形象，风格可爱、灵动，采用水彩或手绘质感，色彩鲜艳柔和。 - 人物特征包括：大眼睛、圆润的红润脸颊，佩戴夸张时尚的配饰（如墨镜、圆环耳环、头巾、发带或蝴蝶结、毛线帽等），服装色彩明亮，人物姿势生动俏皮，身体比例可适当夸张（如头部稍大、腰身纤细）。 - 与节假日或“宜事项”所处季节配套的{人物造型穿着描述} - 人物位于画面中央或偏右，需为文字内容留出充分的留白空间。 - 背景纯白、极简，不含额外装饰元素，突出主体人物与文字。二、日历元素布局： - 上方正中央显著位置：公历日期数字【{公历日期数字}】（字体大而醒目） - 日期数字下方配有英文月份【{英文月份}】 - 日期左右两侧分别标注星期中英文【{星期中文}】【{星期英文}】和农历日期【{农历日期中文}】【{节假日}】，布局左右对称，字体清晰、优雅。三、“宜”与“忌”事项： - 左侧竖排粗体显示当天的【宜】事项：【{宜事项}】，字体为简洁的手写毛笔体，略大，竖向排列。 - 【宜事项】字右边小号字写【{励志句子}】，多列竖向排列，字体相对【{宜事项}】略细略小四、整体说明： - 所有元素的布局要整齐、美观，保持适度的空间留白。 - 文字位置确保清晰易读，避免与插画重叠、遮挡。 </prompt-template> --- 现在请生成该日期的图片：2026-01-01

#时尚 #插画 #黄历 #日历

10个月前

把照片变成分层剪纸艺术作品工具： sora 或者 GPT-4o 提示词：把照片转换成分层剪纸艺术作品，将照片中的中景与背景的分离，并添加标题：2016年芝加哥

#剪纸艺术 #照片转化 #中景与背景分离 #芝加哥 #艺术作品

...