2025-05-31 18:16:00
DeepSeek-R1-0528(R1-V2、新R1)的深度测评来了,代码、3D、物理模拟、设计美学、PPT、幻觉、中文写作都测了边! R1就是基于3月份更新的V3-0324更新的。好消息是现在已经在huggingface开源了、OpenRouter上免费使用,不太需要担心服务器繁忙。 先说说测下来的结论,R1-0528水平确确实实是可以达到Claude3.7,接近Claude4和OpenAI o3。 第一个案例就是我跑出来的巧克力制作3D演示👇完整度相当高。本来这个测试案例本来已经被我拉黑了,除了claude 3.7 sonnet的 Thinking版本,基本都会卡住。 但是,R1-0528 用两次对话就成功了!完整度非常夸张,使用弹跳的粒子系统模拟可可粉,构建出了一个简单的流水线场景,不点击的时候会缓慢旋转。当鼠标点到某个机器上,会有快速旋转的过渡动画,还会有文字标签展示是处于巧克力制作的那方面。侧边栏的文字演示也没有那么落下,给出了每一个环节的详细说明。 (1/7)
2025-05-31 18:16:00
2025-05-31 11:32:51
2025-05-30 12:47:04