orange.ai2025-02-28 08:05:37GPT 4.5 终于发布了,Scaling Law 撞墙说的就是它? 预训练的计算量是 GPT4 的10倍,但是基准测试只比 4o 好 5% Devin 的代码测试超过了 Claude 3.5,但是不如 Claude 3.7 国外网友在吹写作,但是也有人发现不如 DeepSeek R1 输入75美元,输出150美元/百万token,是其他模型的10-100倍。 又贵,又慢,又不够好 非常尴尬#GPT4.5发布#ScalingLaw#基准测试
小互2025-02-13 22:06:43🔥 满血高速能联网 DeepSeek R1 API 获取教程 试了下火山引擎的 DeepSeek R1 API,目前测试下来是最稳定、最快速的方案 推理思考的速度、生成输出token的速度都非常流畅 我申请了个在本地客户端上进行了测试,视频是1倍速度,你们可以感受下。 是我用下来最快的了!而且还能联网。 新注册用户送50万token... 我写了个详细的教程分享下,教程在二楼: ⭐️#DeepSeekR1#火山引擎#API教程
艾森 Essen2025-02-11 06:40:52Uber优步的创始人特拉维斯TravisKalanick最近在参加All In播客节目时,谈到了他对中国式创新的理解,当时Uber在中国推出的任何新功能都能被滴滴等对手以“史诗般的强度”来复制,但随着时间的推移中国人逐渐从模仿走向创新,最终在某些领域超越了Uber,成为了行业的领导者。 同样从模仿到创新的过程也发生在AI领域,DeepSeek R1模型的发布令人震惊,因为它表明中国在AI领域的追#Uber#TravisKalanick#AllIn播客
nazha2025-02-10 20:29:55#分享 从 DeepSeek R1 了解推理模型的训练的四种方法 1. Inference-time scaling 在推理过程中增加计算资源以提高输出质量。一个经典的例子,就是 CoT,在 Prompt 中包含类似 `Think step by step` 的短语,它通过输出更多的 token 增加了计算资源。 2. 纯 RL DeepSeek-R1-Zero 仅通过强化学习而没有初始 #DeepSeekR1#推理模型#训练方法
宝玉2025-02-08 13:21:16深度解析ChatGPT与DeepSeek R1:强化学习如何让大模型学会“思考”? Andrej Karpathy 前几天发的“深度解析像 ChatGPT 的大语言模型“,实在是太长了点,我自己写的翻译软件一运行就崩溃,还要花点时间修复一下(很遗憾 AI 还搞不定),先挑了其中一节讲 DeepSeek R1 的翻译了一下,强化学习如何让大模型学会“思考”。 像 GPT-4o 这种属于传统的预训#ChatGPT#DeepSeekR1#强化学习
orange.ai2025-02-04 11:31:19这几天使用 DeepSeek R1 过程中,有一个问题让我百思不得其解: 为什么一个针对数学和推理优化的模型,却有着极高的文学造诣? 而且这种文学造诣不止是中文,在英文领域 R1 也超过了 Claude,拿下了创意写作榜第一。 这个问题我思考了好几天,直到前几天看到了一篇 Google 的最新论文,于是,我终于可以回答这个问题了。 于是写下这篇文章作为完整的记录。 #DeepSeekR1#数学优化#推理优化
勃勃OC2025-02-04 05:15:16分析师称,DeepSeek R1 的开发成本为 26 亿美元,比 DeepSeek 报告的高出 467 倍 来源:StreetInsider 🤣🤣🤣#DeepSeekR1#开发成本#StreetInsider
李老师不是你老师2025-01-31 17:04:18日本网友测试让DeepSeekR1写一本色情小说。结果提示:“违反了OpenAI的政策” 通过输入这名日本网友的提示词,得到的回复内容可以复现。 #日本网友#DeepSeekR1#色情小说
Mazzystar2025-01-30 23:22:05写了一篇很长的DeepSeek R1科普文,从AlphaGo战胜李世石出发,到ChatGPT类模型的训练困境,和我看到DeepSeek R1真正的闪光点,一路贯穿下来竟然写的心潮澎湃。 特别是在OpenAI和Claude的各种操作和言论后,让我更想把R1-Zero对人类的贡献告诉给更多不懂AI的人。 #DeepSeekR1#ChatGPT#AlphaGo
Jason 杰森2025-01-27 22:27:40在下面这个视频可能预示未来中国人工智能的命运。有人用DeepSeek的网络用户界面提了一个这样的问题:有个照片显示一个人拿着购物袋站在一群坦克前面这个照片是什么照片? 从视频中可以看到,DeepSeekR1模型首先正确的说出,这就是天安门事件中的坦克人照片。但是在显示“天安门事件”前,这个网络用户界面突然改变了自己的回答,然后显示说:“对不起,这超出了我的知识范围,我们来谈别的话题吧。 ”#中国人工智能#天安门事件#DeepSeekR1
九原客2025-01-27 14:38:51有人说DeepSeek R1 的 RL 范式也没啥创新,其实点不在这里。 o1出来后纷纷开始复刻,OpenAI 也不说怎么实现的,也不展示COT数据。所以说蒸馏o1纯属扯淡,OpenAI 防的死死的。 RL 论文上百篇方法几十种,最后 DeepSeek 肯定不是第一家试出来的(比如Google 的 gemini flash 2.0 thinking 就很好),但它是第一家说出来的,善莫大焉。 #DeepSeekR1#RL范式#OpenAI