时政
财经
科技
登录
#深度测评
关注
卡尔的AI沃茨
1个月前
DeepSeek-R1-0528(R1-V2、新R1)的深度测评来了,代码、3D、物理模拟、设计美学、PPT、幻觉、中文写作都测了边! R1就是基于3月份更新的V3-0324更新的。好消息是现在已经在huggingface开源了、OpenRouter上免费使用,不太需要担心服务器繁忙。 先说说测下来的结论,R1-0528水平确确实实是可以达到Claude3.7,接近Claude4和OpenAI o3。 第一个案例就是我跑出来的巧克力制作3D演示👇完整度相当高。本来这个测试案例本来已经被我拉黑了,除了claude 3.7 sonnet的 Thinking版本,基本都会卡住。 但是,R1-0528 用两次对话就成功了!完整度非常夸张,使用弹跳的粒子系统模拟可可粉,构建出了一个简单的流水线场景,不点击的时候会缓慢旋转。当鼠标点到某个机器上,会有快速旋转的过渡动画,还会有文字标签展示是处于巧克力制作的那方面。侧边栏的文字演示也没有那么落下,给出了每一个环节的详细说明。 (1/7)
深度学习模型升级引发AI能力大跃进,行业迎新变革· 20 条信息
#DeepSeek-R1-0528
#R1-V2
#深度测评
#3D
#物理模拟
#设计美学
#PPT
#中文写作
#V3-0324
#HuggingFace
#Openrouter
#Claude3.7
#Claude4
#OpenAI
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞