时政
财经
科技
虚拟货币
其他
登录
#实验
关注
德潤傳媒
4天前
植物能读心?实验显示可能性
#植物读心
#实验
#可能性
#科学
#中性
分享
评论 0
0
Jesse Lau 遁一子
1周前
一早起来看到2个顶级模型都pass了ICPC金牌水平 官方措辞略有不同 让GPT-5 Thinking总结了一下: 下面这两段其实说的是ICPC 世界总决赛期间的两场“AI 试验赛道”,都不计入官方榜单,但使用了同一套题与评测数据,由 ICPC 监督,用来研究 AI 开发工具如何融入竞赛与教学。 共同点(两则通告都强调) 都用 49 届 ICPC 世界总决赛(巴库) 的同一套 12 题与评测数据,由 ICPC 组织/监督,目标是探索 AI 工具与竞赛/教育的结合;均非官方参赛队伍与正式排名。(Kattis) 官方总决赛本身的核心约束:三人一机、5 小时;(世界总决赛环境通常无互联网)。 关键区别 1) 赛道/平台不同 Google DeepMind(Gemini) 参加的是 World Finals Online Judge 实验:远程在线环境,镜像总决赛规则(5 小时、同题、同评测)。对应的公开开放赛在 Kattis(ICPC World Finals 2025 – Open)。(Kattis) OpenAI 参加的是 World Finals Local Judge 实验:在巴库现场的本地评测赛道,面向到场的顶尖选手/教练等的开放活动,本次为 AI 增设了专用测试环境(OpenAI 为唯一 AI 队)。(X (formerly Twitter)) 2) 比赛环境与限制 Online Judge(DeepMind):远程、遵循总决赛规则;DeepMind称其在“遵循 ICPC 规则”的在线环境完成 5 小时解题。 Local Judge(OpenAI):现场本地评测,规则不同于官方总决赛的“三人一机、无网”硬性限制,属于开放式侧活动;此次特设 AI 测试环境,供 OpenAI 提交。*(Local Judge 的具体细则由主办方现场设定,媒体与 ICPC 社媒将其描述为与官方赛制不同的实验性赛道。)* (X (formerly Twitter)) 3) 成绩与亮点 DeepMind(Gemini 2.5):解出 10/12;若计入榜单将相当于第 2 名;并唯一解出一道人类队伍未解出的题(常被媒体提到为题 C)。(The Guardian) OpenAI(GPT-5 系列):在 Local Judge 实验中 12/12 全解(媒体报道:其中 11 题一次通过),属金牌/冠军级别水准。(Financial Times) 4) 与官方总决赛的关系 两者都不是官方参赛队,不列入官方最终成绩表;官方成绩与奖牌仍由现场人类队伍按正式赛制产出。(World Finals) 一句话总结: DeepMind:远程参加 Online Judge 实验 → 5 小时同题环境下解出 10 题、相当第 2。 OpenAI:现场参加 Local Judge 实验(开放式本地侧赛,为 AI 加测环境)→ 解出 12 题、达冠军级。(X (formerly Twitter))
#ICPC
#AI
#DeepMind Gemini
#OpenAI GPT-5
#实验
分享
评论 0
0
央视网-央视新闻
2周前
天宫TV丨“升级版”太空菜园 迎来丰收时刻
实验、演练、测试,神二十乘组又度过了忙碌的一周!
神舟二十号航天员成功进入天舟九号,货物转运工作紧张展开· 4 条信息
#神二十
#航天员
#实验
#演练
#测试
分享
评论 0
0
背包健客
2周前
苍蝇能躲过子弹吗? 🪰🪰🪰
#苍蝇
#子弹
#生物
#趣味
#实验
分享
评论 0
0
背包健客
1个月前
你能用熔岩制作熔岩灯吗?🤔
#熔岩
#熔岩灯
#DIY
#实验
#趣味
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
1个月前
读论文成了研究的主要任务,这岂不是LLM最擅长的?如果实验的sop和过程数据足够,RLVR做推理,AI for science
谷歌Deep Research:AI操作系统雏形?· 79 条信息
#LLM
#研究
#论文
#AI
#实验
分享
评论 0
0
背包健客
1个月前
为什么要在无人机上粘羽毛?🪶🪶🪶
#无人机
#羽毛
#创新
#实验
#趣味
分享
评论 0
0
背包健客
2个月前
为什么葡萄不能放进微波炉烤?🍇🍇🍇
#葡萄
#微波炉
#烤
#物理
#实验
分享
评论 0
0
悉尼閑人
2个月前
沒有比較就沒有傷害! 日本人喝的芬達和中國人喝的芬達,做實驗對比真相讓你驚掉下巴!
#芬达
#日本
#中国
#实验
#对比
分享
评论 0
0
铁锤人
2个月前
已经开通了 TRAE 的 SOLO 模式,你们想实验什么吗?
#Trae
#SOLO模式
#实验
分享
评论 0
0
东方网-东方网
2个月前
海南国际医学中心接连完成两项实验 科研平台建设迈出关键一...
#海南国际医学中心
#实验
#科研平台建设
分享
评论 0
0
背包健客
2个月前
杭州余杭自来水污染,有网友拿滤芯做了下实验。 短短三十秒,水质滤芯快速变得很脏。
#杭州余杭
#自来水污染
#滤芯
#水质
#实验
分享
评论 0
0
Saito
3个月前
这期 Lex Fridman 应该是史上最硬核的播客节目了,嘉宾是华人数学家陶哲轩。 节目里聊到包括 Navier-Stokes 方程、孪生素数猜想和黎曼假设等等,并深入探讨了他解决问题的方法、人工智能在数学中的作用以及理论与实验之间的相互作用。 属于给我逐字稿我也看不明白的程度。
#Lex Fridman
#播客
#陶哲轩
#数学
#Navier-Stokes方程
#孪生素数猜想
#黎曼假设
#人工智能
#理论
#实验
分享
评论 0
0
banboo
3个月前
一个赚钱小实验,48 小时 10 万块。 最近天天下雨,太闲了赚点钱😅
#赚钱
#实验
#下雨
#48小时
#10万块
分享
评论 0
0
背包健客
3个月前
多少罐汽水才能挡住一颗子弹?😮
#实验
#科学
#汽水
#子弹
#生活小窍门
分享
评论 0
0
AI Will
4个月前
如果你给四个AI各自提供一台电脑,然后让它们在线上筹集慈善资金,会发生什么呢?AI Digest决定找出答案。 介绍Agent Village,这是一个为期30天的实验,筹集了2000美元,并且为AI协作和代理提供了一个很好的案例研究。 以下原文🧵
#AI
#慈善
#实验
#资金筹集
#协作
#案例研究
分享
评论 0
0
猫神
5个月前
可以倒在钉子上?真的假的?
#钉子床
#特技
#实验
#表演
分享
评论 0
0
红网-人民日报微博
6个月前
为研究脑机接口他一年洗约500次头
#脑机接口
#科学研究
#实验
#头发护理
#创新科技
分享
评论 0
0
背包健客
7个月前
多少个乐高积木能挡住一颗子弹?🤔
#乐高积木
#子弹
#防护
#实验
分享
评论 0
0
Dash
7个月前
本来想试一下 Grok 3 的内容管控尺度的,一不小心也试出 OpenAI 来了😂
#Grok3
#内容管控
#OpenAI
#实验
#社交媒体
分享
评论 0
0
背包健客
8个月前
圣经真的能挡住子弹吗?🧐
#圣经
#挡住子弹
#实验
分享
评论 0
0
背包健客
8个月前
铸铁锅能挡住子弹吗?🤔
#铸铁锅
#挡子弹
#实验
分享
评论 0
0
背包健客
8个月前
神奇的科学小实验
#科学
#实验
#神奇
分享
评论 0
0
新华网-新华网
8个月前
新疆首次在昆仑山完成无人机增雪作业实验
新疆首次在昆仑山完成无人机增雪作业实验-
#新疆
#昆仑山
#无人机
#增雪作业
#实验
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞