Geek

Geek

0 关注者

3小时前

我脑补今天国内开源大语言模型智谱、千问、Kimi、DeepSeek团队满怀期待的下载 GPT-OSS 使用后,一脸懵逼的问这玩意研发花了多少钱?? 旁边人: 数十亿美元研究的成果🤣

#开源大语言模型 #gpt-oss #智谱 #千问 #Kimi #DeepSeek #数十亿美元 #懵逼

相关新闻

placeholder

GanymedeNil

2小时前

gpt-oss 微调教程来了

placeholder

Austin

3小时前

OpenAI 新模型 gpt-oss 发布了,一看评测也都是各种跑分和看不懂的指标。 有没有大白话评测推理或者阅读理解能力的文章、视频。 或者测试前端 UI 编写也行。

placeholder

歸藏(guizang.ai)

5小时前

昨晚 Open AI 居然发布的是开源模型就是前几天泄露的 gpt-oss-120b 和 gpt-oss-20b Gpt-oss-120b 大致相当于 OpenAI o4-mini,20B 的相当于 o3-mini 120B 需要 80G 显存推理,20B 只需要 16G 显存设备。 目前你知道的所有 LLM 周边生态都已经支持这两个模型,比如 ollama 这种

placeholder

orange.ai

7小时前

OpenAI 开源的两个模型 gpt-oss 并不是说它们有多强(接近 4o-mini 水平肯定是有一点的) 而是优化得比较极致 一个能跑在高端笔记本上 一个能跑在高端手机上 听牛逼的 不过极致的优化下,一般都会带来严重的缺陷和降智 需要一点时间来看看

placeholder

karminski-牙医

8小时前

就在刚刚 OpenAI 发布了两个开放权重模型! 给大家带来深度解析! gpt-oss-120b 激活参数量 5.1B gpt-oss-20b 激活参数量 3.6B 两个都是 MoE 架构的推理模型. 首先, 这两个模型发布的就已经是量化版本了, 他们的 MoE 层直接用 MXFP4 精度训练的! 这意味着暂时没有办法微调这两个模型了 (现有微调框架不支持, 得等等). 然后, 大家肯定

© 2025 news.news. All rights reserved. 0.09528 秒. v1.0.42
我的评论