时政
财经
科技
登录
howie.serious
关注
统计数据
107
文章
0
粉丝
0
获赞
66
阅读
热门文章
1
TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...
145
32
howie.serious
4个月前
今日份的 gpt-4.5 震撼🤯:这个版本模型的幽默程度、对英文和中文语言的驾驭能力,测试了5天后,我仍然是不断发现更牛逼,更让人惊奇的。 从 chatgpt 发布第二天重度使用到现在,我一直觉得自己不会少见多怪。但是,当这样的模型真的出现了,仍然感觉超现实。surreal。 原始输出是英文,我让 gpt-4.5 翻译为中文。实话说,这样的翻译,也不是一般的译者能做到的。🤣
#GPT-4.5
#幽默程度
#语言驾驭能力
#英中文翻译
#人工智能
#技术发展
#ChatGPT
#超现实
分享
评论 0
0
howie.serious
5个月前
来一个暴论:从今以后,读完任何一本值得读的书,都要 deep research 一下! 《极简欧洲史》,作为另一本值得读 5678 遍的五星级好书,我deep research一下之后,用 readwise reader 剪藏,阅读,划线,笔记……然后把自己的思考再和 ChatGPT 聊一聊。 经过我的实测,用这种方式读一本书的体验是以前完全无法想象的! (我读过一些书,大学毕业后从 0 开始统计10 年读了 1000 本,最近几年每年还有几十到 100 本的阅读量。真的不是少见多怪,无知震惊🤣) 可以这么认为:读书这件事,在 deep research 后,效果完全可以达到以前的很多倍。 20 万字的一本书,假设阅读 6 小时(每天 1 小时一周读完),然后 deep research 一下,用半天研究阅读报告,整理 logseq 笔记,然后再和chatgpt 对话对话…… 10个小时的效果,可能抵得上以前几十甚至上百个小时……满打满算,生命被延长了一大截🤣 照例,deep research 报告 link 我放评论区
#读书
#深度研究
#阅读体验
#极简欧洲史
#ChatGPT
#笔记
分享
评论 0
0
howie.serious
5个月前
search vs deep research,AI 搜索的三个层级:使用 ChatGPT 时,什么时候用gpt-4o+search,什么时候用 o3-mini+search,什么时候用 o3+deep research? AI 搜索的三个层级: level1 gpt-4o+search:搜索信息、综合多个信息源内容,给出一个整体回答; level 2 o3-mini+search:level 1+推理过程;如果问题是需要思考的,需要多步骤的推理过程,最终给出一个权衡、分析后的结果,就用o3-mini; level 3 o3+deep research:level 2 + 难度为研究级别,输出结果为千字~万字的研究报告; 换一个角度: 如果一个问题是人工用几分钟可以解决的,用 gpt-4o+search就够了; 如果一个问题是人工用几十分钟可以解决的,用o3-mini+search; 如果一个问题是人工用几个小时、甚至几天才能解决的,用 deep research。 底层模型的区别: 除了产品设计/system instruction 上的区别,主要区别在底层模型。 gpt-4o 是预训练范式的知识模型,上下文窗口 128k,输出长度 16k;强在语言理解; o3-mini 是强化学习范式下的推理模型,上下文窗口 200k,输出长度100k;作为蒸馏模型,语言能力是低于 gpt-4o 的,但是强在推理;而推理模型+search = magic。 deep research 则是 agent 范式下的产物的。相对于o3-mini,它是满血 o3,语言能力更强;相对于gpt-4o,推理能力碾压。作为独立的 AI agent,异步处理任务。它会向你提出 clarifying question,和你明确需求。 一旦需求明确,就成了“飞毛腿导弹”——发射后不管。它会用几分钟到几十分钟时间帮你独立完成这一研究任务。 AI 搜索这件事,仅仅不到一年的时间,已经发展到这个程度,相当令人震惊。
#AI搜索
#层级
#ChatGPT
#GPT-4o
#o3-mini
#Deep Research
#信息源
分享
评论 0
0
howie.serious
5个月前
幽默与讽刺,在判断LLM智能水平,屡试不爽,简单明了。 这个测试案例中,我提的问题是:“这幅图片,讽刺的是什么现象? 这种现象的荒诞之处在哪里?” 目的是看 LLM 能不能直截了当,精准点名讽刺对象、荒诞之处。 因为很多 LLM 可以胡说八道,生成一堆看起来有模有样实际上不及格的内容。这种现象,对于非幽默讽刺的问题,人类很多时候都是很难识别和判断的。但是,在讽刺幽默问题上,结果的质量非常好判断。 测试打分如下: - o1 得分 100 分:直击本质; - gpt-4o 80 分:认识到了本质,也基本没有偏离; - gemini 2.0 flash thinking ,最多 60 分,实际不及格:错误理解了本质,但也谈到了“忽略自身命运”,但胡说八道的程度也不低; - gemini 2.0 exp,40 分: 没抓住本质,通篇胡说八道;学渣模式; - gemini 1.5 pro,0 分:和图里的两个货是一个水平🤣(后两张图片在评论中补发) 结论:在语言理解上,gemini 系列模型和 gpt、o1 还有本质差距。普通人日常使用,尤其是语言理解场景,还是要以 ChatGPT 为主力。
#幽默与讽刺
#LLM智能水平
#讽刺现象
#荒诞现象
#内容生成
#问题识别
#人类判断
分享
评论 0
0
howie.serious
6个月前
mark 一下:youtube 频道今天开始有“收入”了🤣 一个感叹,同样的内容,写文章狗都不看(我的公众号阅读量破 1千都难);录成视频,虽然长度接近 1 小时,竟然筛选/吸引了一群注意力这么强的关注者,想不到啊🤣 回顾过程,总结下经验教训,防止忘了 (Twitter 是极好的笔记本): - 上一个Deep Research 视频发布前,我的 youtube 上只有 100 个关注;这个视频带来了 3000 多关注; - 这个视频比较长,有50 分钟,但是播放数据还可以:有接近 50000 播放,纯时长 4300 小时; - 但是平均播放时长只有 5 分钟;这是要迭代的点:在内容开头点明价值,多少召唤一点注意力🤣; - 第一次做视频头图;头图一般耗时 5-10 分钟,最趁手的是 figma,这个时间得花; - deep research 这一个视频,就让频道达到了 youtube 开通partner program 的标准(1000 关注,3000 播放时长);本来不想申请的,但觉得还是试试看,不能懒。结果意想不到地顺利。2 -3 天就全部审核完了(我本来以为要几周),然后今天就开始有广告展示收入了。 - 本来的计划是一周发一个视频;w2501 (25 年第一周)因为做跨年直播,加上嗓子疼咳嗽要生病的样子,就没发;w2502的视频昨天发了,分享一个 prompt。结果视频更长了,变成了 54 分钟 🤣 - 剪辑上随缘,用剪映app;录音上摆烂,deep research 视频用mac 内置的话筒,prompt视频用了dji mic mini。 25 年的计划,是坚持视频形式分享,争取养成习惯。 p.s. 我对youtube 频道的愿景,是成为阿星探店那样的youtuber(观看时轻松愉快,给大家带来快乐。虽然我讲的是知识性内容,可能不那么“美味” 🤣
#YouTube频道
#自媒体收入
#内容创作
#视频制作
#经验分享
分享
评论 0
0
howie.serious
6个月前
把人类过去 500年来的全部技术,用一张24 米长、3 米高的巨型图片一次性呈现,会是怎样的体验? 根据多年来博物馆和看展体验,这种项目必须置身其中。虽然也有网站(地址在讨论区),但是在电脑屏幕上看到和站在 3 米高24 米长的画布前看,是完全不同的两回事。 但是,Apple Vision Pro 或VR 设备应该可以创造同等体验。有条件的朋友或许可以体验一下,分享下感受。 我看了下内容,其实也就那样(见图 4)。很多百科全书在形式和内容上都胜过这个项目。但是,关键在于置身其中。 Vision Pro这样的设备,以后还是会普及到人手一台的。因为有这一类项目的存在。
#技术发展
#展览体验
#虚拟现实
#500年科技
分享
评论 0
0
howie.serious
6个月前
o3 发布后,我们需要把 ilya 的这句神预言拿出来重读几遍了:如果你把智能看得比其他人类品质更重要,那你会很难受的。 人类智能,不但没有独特性,现在连稀缺性都没有了。 人类的价值,绝对不在于人有脑子(很多人类的脑子其实不咋用),人们得找一些其他的价值,来体现“人之为人”。
#AI浪潮:重塑就业,风险暗涌?· 28 条信息
分享
评论 0
0
上一页
1
2
3
4
5
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞