红杉中国推出了ai agent的基准测试平台 xbench。目前o3在4项测试中全部排名第1,断档式领先。 对于这种新事物,我就不装“万事通”了:大家都是第一次听说,我刚在logseq里面新建了名为“xbench”的笔记,自己转述信息的质量不高,意义不大。 请看来自o3的详细且全面介绍🤣
红杉中国推出了ai agent的基准测试平台 xbench。目前o3在4项测试中全部排名第1,断档式领先。 对于这种新事物,我就不装“万事通”了:大家都是第一次听说,我刚在logseq里面新建了名为“xbench”的笔记,自己转述信息的质量不高,意义不大。 请看来自o3的详细且全面介绍🤣
歸藏(guizang.ai)
3天前
这个有意思, AI Agent 市场 MuleRun 专业知识被打包成可调用的 AI Agent ,供其他人调用,看起来是走社区逻辑
大罗SEO
6天前
ChatBox又成主力了,因为能随时访问o3
jiayuan
6天前
GPT-5 还没有 o3 好用。
Mr Panda
6天前
GPT-5 的Thinking 大概等价于 原来的o3 GPT-5 的通用能力大概等价于 原来的4o