LotusDecoder
11小时前
是啊, 上个月用 sonnet 4.5 感受很好, 思维指导、情绪陪伴这种做得很舒服, 但正是因为 A 厂 这种断供历史加直白搞、针对华人, 我开始琢磨自有 model 了。 万一哪天又断供了,那我一部分 AI 协作出来的能力 基本等于抓瞎。
howie.serious
2天前
gpt-5.1 的指令跟随能力,达到了新高度。 指定“只用8个汉字回复”,gpt-5.1的正确率是100%,而gemini 2.5 pro和sonnet 4.5都是50%左右。 (英文版用6个单词,考虑到单词和单词语义承载能力的差异,增加到8个单词。实际上8-12都可以)