时政
财经
科技
虚拟货币
其他
登录
#Aider
关注
Jesse Lau 遁一子
2个月前
Google推出了最新的 Gemini 2.5 Pro(06 月 5 日版)更新,多项指标 > openai o3 并计划将其作为长期稳定版本。主要亮点包括: - 在 HLE、Aider 和 GPQA 上达到 SOTA(最先进水平) - 新增支持“思维预算”功能 - 成本不变,性能表现处于最优解集合 - 有效修复了 3 月 25 日版本中的性能回退问题
#Google
#Gemini2.5Pro
#AI更新
#SOTA
#HLE
#Aider
#GPQA
#思维预算
#性能优化
#版本更新
分享
评论 0
0
orange.ai
6个月前
R1+Sonnet:我们加起来才是最强的! 在 Aider 的最新多语言基准测试中测试中,R1+Sonnet 超越 o1 拿下第一。 R1 作为架构师, Claude Sonnet 作为编辑器,在 aider 多语言基准测试中设定了新的 SOTA(最先进技术水平)64.0%。 不仅超过了之前 o1 的 SOTA 总体成本还降低了 14 倍。 这件事很神奇,因为使用 o1+ Sonnet 无法超越 o1 自己。 背景信息: Aider 支持使用一对模型进行编码 架构师模型被要求描述如何解决编码问题。思考/推理模型通常在这个角色中表现良好。 编辑器模型接收到架构师的设计方案,并被要求生成特定的代码编辑指令,以将这些更改应用到现有的源文件中。
#R1
#sonnet
#Aider
#多语言基准测试
#SOTA
#O1
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞