马东锡 NLP 🇸🇪2025-03-20 06:31:53LRM论文选读:START: Self-taught Reasoner with Tools 这篇文章介绍了一种构建特定任务、私域Large Reasoning Model的有效方法,主要方法是微调,而且没有使用reinforcement learning,但却有非常类似reinforcement learning with human feedback的特征。 关键词有二: Test-ti
勃勃OC2025-03-16 16:29:56百度公司推出了两款全新的人工智能模型——ERNIE 4.5 和 ERNIE X1,对 AI 行业产生了重大影响。ERNIE 4.5 是新一代多模态模型,在多个基准测试中超越了 GPT-4.5,具备更强的理解、生成、推理和记忆能力,并且成本更低。 该模型在处理多种数据类型方面表现出色,同时有效减少了 AI “幻觉”现象。ERNIE X1 的性能与 DeepSeek R1 相当,但成本仅为其一半,专
九原客2025-03-13 17:31:56目前我日常使用的模型(非广告~) (日常用): - (Grok3 真的很好) - (Qwen2.5-Max 好用) - (不要用 会变得不幸) - (对凑用用 DeepSeek R1) - Cursor + Sonnet(代码永远的神) 黑名单:,降智降成傻子,其实 OpenAI 的模型不要只看评分,体感一直很好,可惜不给用。 (API 用): - (测试各种奇怪的模型,没必要自己
Michael Anti2025-03-11 13:22:00R1时代不要太在意提示词:原来在Deepseek R1出现之前的精彩提示词,现在各种AI已经会Thinking后,效果不好了,反而影响了正常的思考。
外汇交易员2025-03-05 22:15:25#观察 预测生效:苹果刚刚推出了新款Mac Studio,可选配512GB统一内存。该配置可以运行满血版的DeepSeek R1,最低7.4万元即可拥有。让企业可以超低成本部署私有的大模型。这会成为接下来的热议话题。
Gorden Sun2025-03-02 21:57:18olmOCR:可能是目前最好的开源OCR模型 基于微调后的7B视觉语言模型,微调数据为260000页PDF页面,完全开源,包括模型权重、数据和训练代码、推理代码,4090可以本地运行。 Github: 模型: 在线使用: