LinearUncle2025-05-30 08:15:46因为一些突发状况,我5天没碰电脑了。 测试了下Deepseek R1,说实话感觉没有特别突出。 我还是有些失望的,R2是不是难产了? 和闭源顶尖模型能力上的对比,Deepseek除了便宜这一条已经没有其他任何我想得出来的优势了。
AI产品黄叔2025-05-28 23:49:49这一张图,改变了中国的历史!真的不夸张 新DeepSeek R1大幅追上Claude 4 代码能力>Claude 3.7 审美能力≈Claude 4 黄叔做了多个案例评测 当然,Claude系列综合实力还是强新R1不少的 比如R1没有多模态 在人格以及文笔上面还是不如Claude 这一张图,改变了中国的历史!真的不夸张 新DeepSeek R1大幅追上Claude 4 代码能力>Claud
马东锡 NLP 🇸🇪2025-03-20 06:31:53LRM论文选读:START: Self-taught Reasoner with Tools 这篇文章介绍了一种构建特定任务、私域Large Reasoning Model的有效方法,主要方法是微调,而且没有使用reinforcement learning,但却有非常类似reinforcement learning with human feedback的特征。 关键词有二: Test-ti
勃勃OC2025-03-16 16:29:56百度公司推出了两款全新的人工智能模型——ERNIE 4.5 和 ERNIE X1,对 AI 行业产生了重大影响。ERNIE 4.5 是新一代多模态模型,在多个基准测试中超越了 GPT-4.5,具备更强的理解、生成、推理和记忆能力,并且成本更低。 该模型在处理多种数据类型方面表现出色,同时有效减少了 AI “幻觉”现象。ERNIE X1 的性能与 DeepSeek R1 相当,但成本仅为其一半,专
九原客2025-03-13 17:31:56目前我日常使用的模型(非广告~) (日常用): - (Grok3 真的很好) - (Qwen2.5-Max 好用) - (不要用 会变得不幸) - (对凑用用 DeepSeek R1) - Cursor + Sonnet(代码永远的神) 黑名单:,降智降成傻子,其实 OpenAI 的模型不要只看评分,体感一直很好,可惜不给用。 (API 用): - (测试各种奇怪的模型,没必要自己
Michael Anti2025-03-11 13:22:00R1时代不要太在意提示词:原来在Deepseek R1出现之前的精彩提示词,现在各种AI已经会Thinking后,效果不好了,反而影响了正常的思考。