virushuo2025-02-25 08:46:17sonnet 3.7确实不错,分数不假,写码能力应该是目前最好的。给一个token限制让它写码,它会选一些函数不实现,在里面写上 // Implement xxxxx 而它选出来的这些也是我认为也会比较长比较复杂的函数,还是比较有意思的。但我还是更期待QwQ-max-preview,开放模型还是更好玩。#sonnet#写码#模型开放
virushuo2025-02-14 11:17:39o3 achieves a gold medal at the 2024 IOI ... the Codeforces score is at the 99.8-tile - only 199 humans are better than o3. o3已经有拿到信息学竞赛金牌的能力了,现在无论写码能力强弱刷题不刷,在ai面前一律平等了:都是弱鸡。#o3#信息学竞赛#金牌