时政
财经
科技
虚拟货币
其他
登录
#GPT-OSS-120B
关注
karminski-牙医
1个月前
GPT-OSS-20B 比 GPT-OSS-120B 好? 还记得OpenAI的开放权重模型吗?最新的论文评估得到结论 GPT-OSS-120B 在编程方面的确不如 GPT-OSS-20B. 跟我之前测试的结论相同. 论文中指出 HumanEval 和 MMLU 这两个测试中 GPT-OSS-20B 表现均比 120B 效果好。而我自己的评测中,20B编程表现好的方面在于稳定,即基本每次生成都能得到表现一致的效果,当然不是说20B足够好,但是它如果出问题,问题也是稳定的,这样容易修改一些。而120B会在各种地方出问题。 付我上次测试的结论: OSS-120B 和 20B 我觉得有点摸不到头脑, 甚至 20B 生成起来我感觉代码更稳定? OSS-120B 随机性非常大, 在这个测试里面 OSS-120B 甚至反复抽卡8次, 都没有 OSS-20B 抽卡 2 次的效果好. 这里我的猜测是 120B 每次激活专家量很少, 而总专家数量又多, 导致每 token 随机到相同专家的概率会特别小, 进而表现不是那么稳定. 而 20B 则好一些, 4/128 VS 4/32 专家. 我一会也会再测下, 看我的猜测对不对. 论文地址:
#GPT-OSS-20B
#GPT-OSS-120B
#模型评估
#编程能力
#稳定性
分享
评论 0
0
Y11
1个月前
分享openai最新发布的2个开源模型的System cards TLDR版本: GPT-OSS-120b 与 20b 的核心价值在于以开源生态打破技术壁垒,用混合架构实现性能跃升,凭工具整合重构应用场景。 无论是开发者构建垂直模型,还是企业部署 AI 基础设施,这两款模型都提供了 “高性能、低门槛、可定制” 的一站式解决方案。 正如 OpenAI 所言,它们标志着 “开放模型从学术实验走向工业级应用的里程碑”。 这回真没有llama啥事儿了,中文用Deepseek,英文用openai就完事儿了。
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 502 条信息
#OpenAI
#GPT-OSS-120B
#开源模型
#工业级应用
#技术突破
分享
评论 0
0
Geek
1个月前
Cerebras 里的 GPT‑OSS‑120B 可真快啊,我搞几个帐号轮询玩玩😜
#Cerebras
#GPT-OSS-120B
#快速
#轮询
#娱乐
分享
评论 0
0
蓝点网
1个月前
#OpenAI 发布开放权重模型 GPT-OSS-120B 和 GPT-OSS-20B,模型能力媲美 o4-mini 和 o3-mini。这些推理思维链模型可以在本地使用,例如在 M4 MacBook 上采用 20B 版甚至可以每秒输出 30~40tokens,高通也证实这些模型可以在搭载高通骁龙芯片的设备上使用。查看全文:
MiniMax M1发布:开源长上下文推理模型引发AI领域震动· 10 条信息
#OpenAI
#GPT-OSS-120B
#GPT-OSS-20B
#本地部署
#高通骁龙芯片
分享
评论 0
0
Geek
1个月前
魔搭刚刚已上新 GPT-OSS-120B & GPT-OSS-20B,实测 API 还不能调用,但应该快了🥳
#魔搭
#GPT-OSS-120B
#GPT-OSS-20B
#API
#上新
分享
评论 0
0
Inty News
1个月前
重磅新闻:ChatGPT 母公司Open AI 刚刚开源了两个AI推理模型—— gpt-oss-120b gpt-oss-20b
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 502 条信息
#ChatGPT
#OpenAI
#AI推理模型
#GPT-OSS-120B
#GPT-OSS-20B
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞