时政
财经
科技
登录
#SOTA
关注
karminski-牙医
2周前
Google Gemini-2.5 系列的技术报告出了, 有很多高价值信息 比如这个,确认的确是MoE架构的。虽然大家都能猜到现在头部闭源模型是MoE的,但这个是第一次书面确认是MoE的。 另外从价格vs性能这张图来看,Gemini-2.5 系列的确在性价比上建立了一个非常好的护城河,Gemini-2.5-Pro 就是现在的 SOTA 文本模型,Gemini-2.5-Flash 则是目前则专门对着 GPT-4.1 打。 我看这周或者下周有时间给大家安排个详细解读。 技术报告地址:
Google Gemini 2.5发布引发AI模型性价比热议· 21 条信息
AI编程:Gemini免费用,Claude手机玩· 192 条信息
#Google
#Gemini-2.5
#MoE架构
#闭源模型
#性价比
#SOTA
分享
评论 0
0
Jesse Lau 遁一子
3周前
Google推出了最新的 Gemini 2.5 Pro(06 月 5 日版)更新,多项指标 > openai o3 并计划将其作为长期稳定版本。主要亮点包括: - 在 HLE、Aider 和 GPQA 上达到 SOTA(最先进水平) - 新增支持“思维预算”功能 - 成本不变,性能表现处于最优解集合 - 有效修复了 3 月 25 日版本中的性能回退问题
#Google
#Gemini2.5Pro
#AI更新
#SOTA
#HLE
#Aider
#GPQA
#思维预算
#性能优化
#版本更新
分享
评论 0
0
阑夕
3个月前
昆仑万维今天发的音乐大模型Mureka O1,指标上已经达到了SOTA,当然吹的文章你们肯定不想看,直接上作品最有说服力,这首歌曲从歌词到谱曲再到人声都是AI完成的,画面是后期用剪映配的,旧版本音乐大模型里挥之不去的那种AI电流感几乎已经听不出来了,你们觉得如何?客观打个分。
#昆仑万维
#Mureka O1
#音乐大模型
#AI歌曲
#SOTA
分享
评论 0
0
orange.ai
5个月前
R1+Sonnet:我们加起来才是最强的! 在 Aider 的最新多语言基准测试中测试中,R1+Sonnet 超越 o1 拿下第一。 R1 作为架构师, Claude Sonnet 作为编辑器,在 aider 多语言基准测试中设定了新的 SOTA(最先进技术水平)64.0%。 不仅超过了之前 o1 的 SOTA 总体成本还降低了 14 倍。 这件事很神奇,因为使用 o1+ Sonnet 无法超越 o1 自己。 背景信息: Aider 支持使用一对模型进行编码 架构师模型被要求描述如何解决编码问题。思考/推理模型通常在这个角色中表现良好。 编辑器模型接收到架构师的设计方案,并被要求生成特定的代码编辑指令,以将这些更改应用到现有的源文件中。
#R1
#sonnet
#Aider
#多语言基准测试
#SOTA
#O1
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞