gpt-4.5的 IQ 得分出来了，94分，似乎并不高（deepseek-R1 是 102 分）。那么，现在的llm，IQ分别是多少？即将发布的 o3，IQ 到底会有多高？先看结果排名： o1 —— 124；o1 pro mode ——120； o3-mini——116； gpt-4o——91；gpt-4——80； Trackingai 网站上的 IQ 分数分为两套：线下IQ 测试，和线上

#GPT-4.5 #IQ得分 #DeepSeek-R1 #llm排名 #O1 #o3 #GPT-4o #GPT-4 #Trackingai

相关新闻

-Zho-

3个月前

在 8 个月后，Nano Banana Pro 终于也能像当初 GPT-4o 一样玩转各种可爱风格了！ Nano Banana Pro = 可爱 3D emoji！ 🛁🛁🛁 ZHNO｜创意系列｜Nano Banana Pro 【Prompt】⬇️

Geek

3个月前

火山方舟第二期协作奖励计划开始搞了： - 合作期延长至2026年3月31日 - 每日单模型免费额度从 50 万提升至 200 万 Tokens。有 DeepSeek-V3.1、Kimi-K2、DeepSeek-R1 还不错，感兴趣的朋友不妨多注册几个账号(要实名)，DeepSeek 不就自由了嘛。

Geek

4个月前

我为亲友们搭了一个AI平台，提供多种主流模型。尽管我推荐他们尝试 Gemini 2.5 PRO、GPT-5或GLM-4.6，但一直以来他们始终只使用 DeepSeek-R1。起初我不解，为何不试试更强大的模型，后来才意识到，DeepSeek-R1/V3 已完全满足他们的日常使用场景。也好，现在我能轻松找到 R1 的免费资源供应😅

GitHubDaily

4个月前

在医院拍完胸部 X 光后，经常还需要排队等待拿结果给医生查看分析，折腾下来基本都要一个多小时。最近在 GitHub 上看到的 MedRAX 这款开源的医学影像分析智能体，正在试图改变我们这种传统方式。它集成了多个专业的胸部 X 光分析工具，基于 LangChain 和 LangGraph 框架构建，使用 GPT-4o 作为核心大模型。整合了视觉问答、图像分割、病灶定位、报告生成、疾病分

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

4个月前

GenAI到CogAI的范式鸿沟：从F(q|internet)到F(q|you) 当我们惊叹于ChatGPT能写诗、写代码、做翻译时，一个根本性的问题被掩盖了： GPT-4在优化什么？标准答案是： $\min_\theta \mathbb{E}_{(x,y) \sim p_{\text{internet}}}[-\log p_\theta(y|x)]$ 即：在整个互联网语料上，最小化预测误差