sitin

sitin

0 关注者

14小时前

OpenAI 时隔六年首次开源两款大模型(GPT-OSS-120B 和 GPT-OSS-20B),主打“高性能+可商用+本地部署”,在推理、工具使用等关键能力上接近甚至超越自家专有模型,并允许开发者自由微调、集成到各种应用场景。 1.架构创新 混合专家(MoE)设计: GPT-OSS-120B(1170亿参数,每token激活5.1亿参数) GPT-OSS-20B(210亿参数,每token激活3.6亿参数) 显著降低计算开销,支持128K长上下文与分组多查询注意力机制468。 2.性能对标闭源模型 120B:接近闭源模型o4-mini,在编程(Codeforces 2622分)、数学(AIME 96.6%)、医疗(HealthBench 57.6%)测试中表现优异267。 20B:接近o3-mini,可在16GB内存设备(如笔记本)运行,适合边缘计算138。 3.专为智能体(Agent)优化 原生支持函数调用、网页搜索、Python执行,工具调用失败率仅4.7%(120B)68。 提供低/中/高三档推理力度,平衡延迟与精度