orange.ai

orange.ai

0 关注者

9个月前

卧槽,我在 Google Gemini Thinking 中竟然体验到了 DeepSeek R1 Zero 的论文里提到的语言的混乱现象 出现了很多种,完全分辨不出来是什么语言... 难道 Google 这个思考模型也是靠大量 RL 搞出来的吗?

#Google Gemini #DeepSeek R1 Zero #语言混乱 #思考模型 #RL

相关新闻

placeholder

Gorden Sun

2周前

Cursor发布了Composer模型,Windsurf发布了SWE-1.5模型,AI IDE都开始自研模型,摆脱对模型厂商的依赖。AI IDE有用户的使用场景和数据,做好RL在代码领域可以一战。

placeholder

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

3周前

RL为什么会导致Model collapse,自相似性危险: 模式崩塌(Mode collapse): - 重复生成相同内容 - "我是AI助手,我是AI助手,我是AI助手..." - 失去多样性 过度规律化: - 所有回答都遵循相同模板 - 失去创造性和灵活性 - "机械感"

placeholder

Jesse Lau 遁一子

1个月前

openai这几套组合拳下来,google gemini本周出啥都没啥浪花了。 作为网站站长中间商,我是希望google的入口能继续保持领先,以Google为首的IAB广告生态系统可以达到循环不息 而openai作为破局者,chatGPT作为入口则很多中间环节将消失

placeholder

Jesse Lau 遁一子

1个月前

openai这几套组合拳下来,google gemini本周出啥都没啥浪花了。

placeholder

dontbesilent

1个月前

欢迎大家选购三星盖乐仕系列平板电脑 ✨ Galaxy AI 已系统级集成 Google Gemini

© 2025 news.news. All rights reserved. 0.09437 秒. v1.0.46
我的评论