时政
财经
科技
虚拟货币
其他
登录
#SOTA
关注
Tom Huang
1天前
7.7K Star ⚡️ 最好的开源 Deep Research 平台发布! Langchain 这个 open-deep-research 效果也太好了,在全球 DeepResearch benchmark 上登顶最好的开源 SOTA 效果 🔥 开源地址 👉
#开源
#Deep Research
#LangChain
#SOTA
#Benchmark
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
4天前
看字节seed这研究趋势,不会截胡了DeepSeek的下一个突破吧?🤔 北京大学、ByteDance Seed和香港大学研究:SWE-Swiss——一个用于构建人工智能的完整训练“公式”,用于解决软件工程任务。 基于此,他们的32B参数SWE-Swiss-32B在SWE-bench Verified上达到了60.2%,为其尺寸设定了新的SOTA。 这证明,通过合适的方法,中型模型可以超越其重量。
#字节Seed
#DeepSeek
#SWE-Swiss
#软件工程任务
#SOTA
分享
评论 0
0
karminski-牙医
1周前
GPT-5 召回的确牛逼,所以接 RAG 目前应该是最佳选择。 Fiction.LiveBench 测试数据,192K上下文仍然有 87.5%, 妥妥 SOTA 了. 奥特曼其实应该把这个数据拿出来炫的,从o3开始其实 OpenAI 系列模型的召回能力都是可圈可点的。 #GPT5
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 327 条信息
#GPT-5
#RAG
#OpenAI
#奥特曼
#SOTA
分享
评论 0
0
Jesse Lau 遁一子
2个月前
Google推出了最新的 Gemini 2.5 Pro(06 月 5 日版)更新,多项指标 > openai o3 并计划将其作为长期稳定版本。主要亮点包括: - 在 HLE、Aider 和 GPQA 上达到 SOTA(最先进水平) - 新增支持“思维预算”功能 - 成本不变,性能表现处于最优解集合 - 有效修复了 3 月 25 日版本中的性能回退问题
#Google
#Gemini2.5Pro
#AI更新
#SOTA
#HLE
#Aider
#GPQA
#思维预算
#性能优化
#版本更新
分享
评论 0
0
阑夕
4个月前
昆仑万维今天发的音乐大模型Mureka O1,指标上已经达到了SOTA,当然吹的文章你们肯定不想看,直接上作品最有说服力,这首歌曲从歌词到谱曲再到人声都是AI完成的,画面是后期用剪映配的,旧版本音乐大模型里挥之不去的那种AI电流感几乎已经听不出来了,你们觉得如何?客观打个分。
#昆仑万维
#Mureka O1
#音乐大模型
#AI歌曲
#SOTA
分享
评论 0
0
orange.ai
6个月前
R1+Sonnet:我们加起来才是最强的! 在 Aider 的最新多语言基准测试中测试中,R1+Sonnet 超越 o1 拿下第一。 R1 作为架构师, Claude Sonnet 作为编辑器,在 aider 多语言基准测试中设定了新的 SOTA(最先进技术水平)64.0%。 不仅超过了之前 o1 的 SOTA 总体成本还降低了 14 倍。 这件事很神奇,因为使用 o1+ Sonnet 无法超越 o1 自己。 背景信息: Aider 支持使用一对模型进行编码 架构师模型被要求描述如何解决编码问题。思考/推理模型通常在这个角色中表现良好。 编辑器模型接收到架构师的设计方案,并被要求生成特定的代码编辑指令,以将这些更改应用到现有的源文件中。
#R1
#sonnet
#Aider
#多语言基准测试
#SOTA
#O1
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞