GPT-5模型的各种跑分都是按reasoning_effort=high来的,而ChatGPT里的这个GPT-5作为一个自动路由模型,很多时候都不会触发推理(于是连9.8和9.11哪个大都回答不好),可能这就是落差如此大的原因? (GPT-5 Thinking就好很多)
GPT-5模型的各种跑分都是按reasoning_effort=high来的,而ChatGPT里的这个GPT-5作为一个自动路由模型,很多时候都不会触发推理(于是连9.8和9.11哪个大都回答不好),可能这就是落差如此大的原因? (GPT-5 Thinking就好很多)