时政
财经
科技
虚拟货币
其他
登录
#R2
关注
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
1个月前
Difficulty Adaptive Rollout Sampling (DARS) 据说可以解决DeepSeek的GRPO的偏差累积问题?上一个号称改进GRPO训练稳定性都是qwen的GSPO。 DeepSeek 的R2会是什么创新呢?
深度学习模型升级引发AI能力大跃进,行业迎新变革· 96 条信息
#DARS
#DeepSeek
#GRPO
#偏差累积
#R2
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
1个月前
关于DeekSeek的R2 谁啊,谁说的创新突破可以接二连三?!
深度学习模型升级引发AI能力大跃进,行业迎新变革· 96 条信息
#deekseek
#R2
#创新
#质疑
#负面
分享
评论 0
0
BadUncle
3个月前
我猜做ai coding的开发商比我们用户更恨sonnet吧,他们强烈希望r2能早点出来搅局,因为模型越好用api越贵啊,而自研的可用性又跟不上 无论是cursor还是jetbrains,一方面依赖上游大模型一方面也心有不甘,总感觉为他人做嫁衣裳 只有aider cline这种无所谓,反正用户买单 最开心的还是anthropic,目前也包括claude code订阅用户,越用护城河越高 问题是,deepseek还能不能在缺乏算力的背景下有更多的腾挪空间呢?
AI编程工具激战:Claude Code、Gemini Cli崛起· 906 条信息
#AI Coding
#sonnet
#R2
#大模型API价格
#Anthropic
分享
评论 0
0
JimmyLv (🐣, 🐣) 2𐃏25
3个月前
DeepSeek要是出R2了,Cloudflare可咋办呀?🥲
#DeepSeek
#R2
#CloudFlare
分享
评论 0
0
东方网-澎湃新闻
4个月前
DeepSeek R2没等来,R1“小升级”发布:思考时...
深度学习模型升级引发AI能力大跃进,行业迎新变革· 96 条信息
#DeepSeek
#R2
#R1
#技术升级
#发布
分享
评论 0
0
澎湃新闻-10%公司
4个月前
DeepSeek R2没等来,R1“小升级”发布:思考时间更长,效果如何?
深度学习模型升级引发AI能力大跃进,行业迎新变革· 96 条信息
#DeepSeek
#R2
#R1
#升级
#效果
分享
评论 0
0
宝玉
8个月前
rclone 是个神器,用来管理网盘、云存储太好用了,就是命令行为主门槛有点高。我的 Dropbox 内容一直想迁移到 Google Drive 上,之前没合适工具一直拖着,现在终于在用它迁移了,甚至还能管理 CloudFlare 上 R2 的文件!
#rclone
#Dropbox
#Google Drive
#CloudFlare
#R2
#云存储
#迁移
#命令行工具
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞