dontbesilent
1周前
欢迎大家选购三星盖乐仕系列平板电脑 ✨ Galaxy AI 已系统级集成 Google Gemini
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
3周前
arXiv预印本2509.04259,探讨了在线强化学习(RL)在fine-tuning基础模型时为什么比监督微调(SFT)遗忘更少的问题 RL’s Razor:在所有解决新任务的策略中,RL偏好KL散度(Kullback-Leibler divergence)相对于原始模型最小的解决方案
Oasis Feng
3周前
ColorOS 仿 Google Gemini 这个「识屏提问」的功能还算堪用。 不过为啥不能直接给我链接呢?