时政
财经
科技
虚拟货币
其他
登录
#指令跟随能力
关注
howie.serious
9小时前
gpt-5.1 的指令跟随能力,达到了新高度。 指定“只用8个汉字回复”,gpt-5.1的正确率是100%,而gemini 2.5 pro和sonnet 4.5都是50%左右。 (英文版用6个单词,考虑到单词和单词语义承载能力的差异,增加到8个单词。实际上8-12都可以)
#GPT-5.1
#指令跟随能力
#Gemini 2.5 Pro
#Sonnet 4.5
#性能对比
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞