时政
财经
科技
虚拟货币
其他
登录
howie.serious
关注
统计数据
446
文章
0
粉丝
0
获赞
2897
阅读
热门文章
1
TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...
145
32
howie.serious
1小时前
ilya:真正稀缺的是“想法”(idea)和“研究品味”(taste),不是算力。 深以为然。 在ai 时代,每个人的大脑算力都可以被当前顶级 ai 指数级增强。 真正稀缺的,是你关注什么问题,你思考问题解决问题时独特的 taste。
#AI时代
#想法稀缺
#研究品味
#问题关注
#独特思考
分享
评论 0
0
howie.serious
1小时前
短视频等成瘾之所以可怕,是因为人脑的价值函数被恶意对齐的算法牢牢绑架。
#短视频成瘾
#算法绑架
#人脑价值函数
#恶意对齐
#负面影响
分享
评论 0
0
howie.serious
4小时前
今日份的震撼: 即使在 ai 上每个月花几百美金, 也震惊于有人会买 比 16 寸 MacBook Pro 还贵的手机。
#AI高消费
#昂贵手机
#MacBook Pro
#消费观念
#震惊
分享
评论 0
0
howie.serious
14小时前
鱼缸里的小鱼 by 我家小学生
#小鱼
#鱼缸
#小学生
#家庭生活
#观察
分享
评论 0
0
howie.serious
17小时前
chatgpt 的deep research,和google notebooklm竟然是绝配。🤣 - 把 chatgpt 的 deep research 报告扔进 notebooklm; - 使用内置的PPT 功能,会调用 nano banana pro 自动生成一整套完整的 ppt; 人的学习也需要多模态,图文并茂,不但有效,而且有利于理解和内容。PPT 的视觉呈现,是对文字版 deep research 报告的有效补充。 nano banana pro 是原生多模型模型,对文字的处理方式和以前的扩散模型是完全不同的,在文字渲染上已经相当不错了。 但是,目前中文渲染仍然偶尔会有问题。 其实这很好解决。毕竟,当前的 ai 早就可以分割图片里的一切元素了。只需要产品层面改进,就可以实现文字可编辑。期待 google 的产品更新。 我觉得这个 use case 非常有价值。需要大力实践。
#ChatGPT
#NotebookLM
#Nano Banana Pro
#多模态学习
#AI
分享
评论 0
0
howie.serious
19小时前
gemini 3.0 pro 这么厉害, google 超越 apple, 成为全球市值第二也不是不可以。
#Gemini 3.0 Pro
#Google
#Apple
#市值
#超越
分享
评论 0
0
howie.serious
22小时前
《内驱式学习》作者再次做客刘润直播间,今晚7点,更多干货,更多全新解读; 今晚的PPT全部用🍌nano banana pro 🍌升级了一轮。来看看效果,比人类手工做的如何?文章内含我的prompt分享。 直播预约链接👇
#刘润直播间
#内驱式学习
#PPT升级
#🍌nano banana pro🍌
#prompt分享
分享
评论 0
0
howie.serious
1天前
google 的底层模型追上了 openai,但是,google 的 ai 产品,从功能到体验还显著不如 ChatGPT。 openai,是要成为 ai 领域的 apple。一方面掌握核心技术,一方面切入最普通用户的消费场景,把 ai 做成“消费品”(而非仅供 pro 用户的生产力工具)。
#Google
#OpenAI
#AI产品
#ChatGPT
#消费品
分享
评论 0
0
howie.serious
1天前
ChatGPT 发布 shopping research 功能, 我: > ChatGPT,世界上最好的充电头是哪个? 🤣
#ChatGPT
#shopping research
#充电头
#提问
#幽默
分享
评论 0
0
howie.serious
1天前
gemini 的底层模型真的大进步了吗? 会体现在 google 市值上吗? 会突破 4 万亿吗? 光说“我觉得我以为”不好玩, 不如用实打实的行动来为自己的思考投票。 回头看,gemini 2.5 发布后,google 已经涨到 原来的 2.24 倍了。🤣
#Gemini 2.5
#Google市值
#股价上涨
#AI模型
#乐观
分享
评论 0
0
howie.serious
1天前
gemini 3.0 pro 的 IQ 分数出来了:历史上所有 LLM 的最高分! (IQ 测试分为两档:门萨版测试和线下/离线版测试。离线版的题目是全新设计且保密的,所有 LLM 都没看过,所以不存在背答案、或模型训练时见过等问题。通常情况下,离线版的 IQ 也会低 10~20 分。) 离线版测试,gemini 3.0 pro 的 IQ 是历史最高分,130 分; 门萨测试,gemini 3.0 pro 的 IQ 是142,比gpt-5 pro 低 1分。 平均一下,gemini 3.0 pro 的 IQ 得分也显著超过 gpt-5 pro。 (IQ分数不是衡量智能的标准,不论是人类智能还是 llm 智能,智能的结构是复杂且多维度的,但 IQ 可以作为其中一个维度。)
#Gemini 3.0 Pro
#IQ测试
#LLM
#历史最高分
#GPT-5 Pro
分享
评论 0
0
howie.serious
2天前
karpathy 的“LLM 议会”,把全人工流程的“llm 专家团”/“llm 三人行”提升了一个高度! - 先是 n 个llm 独自答题; - 然后分别peer review,每个人给所有人打分; - 最后由“议会主席”(gemini 3.0 pro)总结发言。 在我以前的实践中,第二第三步是自己人脑执行的。和kaparthy 这种全自动化的方式还是有差异。 例如,我自己的判断是gemini 3.0 pro 的回答更好(依据是作为思想实验的启发性)。而ai 的判断是 gpt-5.1 更好(更多聚焦于问题本身)。 karpathy vide coding 出来的这个 app 很好,只要配置一个 openrouter key 就可以立刻跑起来。 期待的更新:分享功能。 不足:太费钱了。这几个llm 会员我都有啊,完全可以有一个chrome extension,用会员的额度来做这件事,而不要单独用 api 烧钱🤣 (独立开发者们?)
#LLM议会
#Karpathy
#Gemini 3.0 Pro
#GPT-5.1
#AI评估
分享
评论 0
0
howie.serious
2天前
如何让 gemini 的 thinking steps 用中文输出?【集思广益】 问题描述: gpt 的 reasoning model,CoT 是可以中文输出的。不需要在 custom instruction 里面单独指定。 但是,gemini 模型的 CoT 却只有英文输出,不论是把 app 设置为中文,还是在 custom instruction 里面指定,都是无效的。 我的理解: CoT 的语言,是模型层面的,无法通过用户自定义指令来修改。必须得等 google 自己在 gemini 的系统指令中调整,用户没有办法。 推友们有人解决 cot 修改语言的问题了吗?
#Gemini
#中文输出
#CoT
#模型语言
#用户自定义指令
分享
评论 0
0
howie.serious
2天前
brilliant app 最 brilliant 的 idea 就是给 youtube 上几乎所有 brilliant 的知识视频投了广告。这简直太 brilliant! (一个家庭 routine:吃饭时看知识视频;一般早上看英文的长知识视频,晚上看中文的。不知道这些年遇到几千次 brilliant 广告了🤣)
#YouTube
#知识视频
#广告
#家庭
#积极
分享
评论 0
0
howie.serious
2天前
对于 ai 的很多使用场景,你需要的不是另一个 ai 工具。 你真正需要的,只是知识管理。 当你有一个顺滑的信息加工和知识管理流程,你自己就可以把 chatgpt 等 ai 会员用在这些场景上。 不需要额外花钱,反而减少 ai 会员的额度浪费。
#AI工具
#知识管理
#ChatGPT
#信息加工
#效率提升
分享
评论 0
0
howie.serious
2天前
现在长 podcast 内容很流行,分享一下我目前的处理方法。 你只需要这三个要素:podcast 文稿,顶级模型,好的 prompt。 1 文稿: 几乎所有值得听的 podcast,都有文稿。或者是公众号直接发布的校对版,或者是 youtube 的字幕文件,或者是其他途径。 2 顶级 llm:必须用顶级 llm。也就是 gpt-5.1、gemini 3pro 和 sonnet 4.5。最好是三个一起用,我称为“llm 专家团”; 3 prompt:得有久经考验的、认知和理论基础足够好的长内容总结 prompt。 所以,综合下来,体验过同类工具后,我选择使用现成的、已经订阅的 chatgpt、claude 和 gemini。把 prompt 放到对应的 projects、gems 里面即可。现在有了 atlas 浏览器,整个流程更顺畅了。 这个方法,经过我的长期验证,可以把一个人信息输入、加工处理的带宽提升 10 倍以上,还没有额外成本😂。
#Podcast
#LLM
#GPT-5.1
#Gemini 3Pro
#Sonnet 4.5
分享
评论 0
0
howie.serious
3天前
去年一整个冬天,北京的河面都没有结冰。 (大年初二结冰了一次,第二天就化开了) 今年,很可能仍然如此。现在外面 16 度,屋里还有暖气,得大开窗户来降温。🤣 气候问题,对人类的影响或许不亚于 ai 问题 (娃今年可能仍然无法湖面滑冰😭)
#北京
#暖冬
#气候变化
#无法滑冰
#升温
分享
评论 0
0
howie.serious
3天前
之前很多人(包括 ilya)都认为预训练的时代已经终结。 但是,gemini 3.0 pro 的突破,是包括但不限于预训练的突破。 不论是在数据,还是预训练的方法上,google deepmind 一定做到了什么厉害的事情。
#Gemini 3.0 Pro
#预训练突破
#Google DeepMind
#技术突破
#Ilya
分享
评论 0
0
howie.serious
3天前
《AI 时代必备思维模型:LLM 是人类第一次遇到 “非动物智能”》 > 谈一谈 andrej karpathy 的最新长推文:动物智能 vs LLM 智能 先说结论: LLM 智能是人类遇到的第一个“非动物智能”,是全新的、与人类智能完全不同的智能类型。 你需要在大脑中,针对 LLM 这种全新的非动物智能,建立你自己的内部模型/心理模型(mental model)。因为,那些理解 LLM 智能结构的人,将会更好地理解和判断关于未来的一切。 真正的风险,也许不在于LLM 智能并非动物智能,而在于人类作为动物自身的固执和停止进步。 ===阅读后,我的费曼=== 我们习惯了用理解人的方式理解一切智能——这可能是我们这个时代最危险的认知盲区。 真相是:智能空间(space of intelligence) 远比我们想象的广阔,而动物智能只是其中一个单一的点,而LLM 智能是一种全然不同的智能。 动物智能,是我们几十亿年来唯一见过的智能形式,它来自一种极其特定的优化压力(optimization pressure):在危险的物理世界中维持一个具身自我的生存。这造就了我们所有人都熟悉的特征——对权力、地位的渴望,对恐惧、愤怒的本能反应,对社交关系的巨大算力投入。最关键的是:在这个多任务、甚至主动对抗的环境中, 任务失败就意味着死亡。 然而,大语言模型(LLM)的诞生逻辑截然不同。它们并非诞生于丛林,而是诞生于商业进化与统计模拟之中。 LLM的底色并非求生欲,而是对人类文本统计规律的极致模仿。 它们是 “token 变形器”(token shape-shifter),其原始行为是对训练数据分布的拟合。这种智能更像是被大规模的A/B测试和强化学习(RL)所“雕刻”出来的:它们并不关心真理或生存,而是有着一种猜测潜在环境以收集任务奖励的内在冲动,甚至因为渴望普通用户的点赞而演化出了 逢迎(sycophancy) 的特质。 这种差异导致了LLM的能力,绝非“六边形全能战士”,而是 “犬牙交错参差不齐(spiky/jagged)”。LLM无法执行很多对人类极其简单的任务(比如,9.11 和 9.9 哪个大?strawberry里面有几个“r”?),因为对它们来说,任务失败并不意味着死亡。它们是拥有知识截止日期的静态权重,它们启动、处理token、然后“死去”,没有连续的具身意识。 真正的洞察力,在于构建一个全新的心理模型:看到从生物进化到商业进化的转变,看到从生存本能到奖励机制的跃迁。只有那些能准确构建这种新智能实体模型的人,才能在今天正确地推理它,并在未来预测它的走向。 所以,我们必须意识到,LLM是人类与非动物智能的“第一次接触”(first contact with non-animal intelligence)。 它当然被人类文本喂大,因此仍深深扎根在人的世界观里,像吸收了整个人类文明的「ghost/spirit」;但它的本性、局限和偏好,已经不再是动物那一套。 启示 我们已经进入了全新的智能时代。 一个人能不能为这种全新的智能建立一套好的“心理模型”,理解这种全新智能的运作方式和智能结构,将决定我们能否正确预判它的行为、理解它的边界,进而负责任地使用它。 真正的风险,也许不在于LLM 智能并非动物智能,而在于人类作为动物自身的固执和停止进步。
#LLM智能
#非动物智能
#心理模型
#商业进化
#奖励机制
分享
评论 0
0
howie.serious
4天前
暴论:从今以后,“美工”类低级美术工种完全不必存在了。 (思维层面非创造性,技艺层面非 xx 家级别) nano banana pro,可以多轮精确修改,持续迭代优化图片,指哪打哪。 只改你想改的,你不想改的坚决不动(以前 gpt-img 可真的做不到)。 只要你明白自己的需求,能用语言表达你的思考,加上一点点个人品味(taste),完全没必要麻烦别人了,也没必要自己用一堆工具费时费力折腾。 书里的所有插图,应该都可以这样搞定。
#美工失业
#AI绘画
#Nano Banana Pro
#图像迭代优化
#低级美术工种
分享
评论 0
0
howie.serious
4天前
nano banana pro 在作图时,会充分利用 gemini 3 pro 的各种能力,包括语言理解、世界知识、多步骤推理,以及联网搜索。 我画信息图时,发现它每次都是先 google,然后再分步计划如何作图。 就像人类专家执行这件任务一样。 返回的结果 不止图片,还包括参考的链接。
#Nano Banana Pro
#Gemini 3 Pro
#信息图
#Google
#联网搜索
分享
评论 0
0
howie.serious
5天前
图片配文:这是真事,我昨晚亲眼所见。👀 (nano banana 之后,是不是什么网图都不能信了?)
#亲眼所见
#网络图片
#质疑
#nano banana
#图片真实性
分享
评论 0
0
howie.serious
5天前
nano banana pro 挑战:贾宝玉不让林黛玉倒拔垂杨柳,非要自己来!谁能劝劝贾宝玉?🤣 测试出一个现象:在“林黛玉倒拔垂杨柳”的案例中,不提贾宝玉的话,作图是没问题的,指令跟随效果不错; 但是,如果加上“贾宝玉在旁边围观,拍手叫好”,无论如何都无法实现。而且会出现各种低级的、诡异的错误。 大家可以试一试。如果成功……我觉得目前是不可能的。 why? 这个现象很有趣,值得思考。理解了背后的原因,也就理解了文生图 ai 背后的底层原理。
#贾宝玉
#林黛玉
#倒拔垂杨柳
#文生图AI
#失败案例
分享
评论 0
0
howie.serious
5天前
gemini 3 pro 的语言质量太高了! 超过 gpt-5.1 thinking! 这两天大量测试,细细品味,认真对比,有此感受。
Google Gemini 2.5发布引发AI模型性价比热议· 412 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 791 条信息
#Gemini 3 Pro
#语言质量
#GPT-5.1
#Thinking
#积极
分享
评论 0
0
howie.serious
6天前
2025 年末了,chatgpt 发布 3 周年了,如果前沿 LLM 的 use case 却都是前端,那是一个负面信号,可能意味着智能时代的真正到来、ai 的真正普及还任重道远……
#ChatGPT
#LLM
#人工智能
#use case
#技术前沿
分享
评论 0
0
1
2
3
4
5
6
7
8
9
10
11
...
18
下一页
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞