时政
财经
科技
虚拟货币
其他
登录
#模型对比
关注
howie.serious
1天前
同样的写作类 prompt,gpt-5 和 gpt-4.5 的输出有质的差距。 gpt-5 还是偏好用大词(强化学习后训练出来的模型都这样?越降本增效,大词问题越严重?)。内容上不如 gpt-4.5 更丰富,更清楚全面地解释本质。语言上,用词和文风都不如 gpt-4.5。 当然,gpt-5 的问题必须和 gpt-4.5 横向对比,认真阅读,甚至多次阅读,才能看出来差异。 不对比 gpt-4.5 的话,gpt-5 的输出是不错的🤣
OpenAI GPT-5发布引发用户不满,阿尔特曼回应质疑· 14 条信息
#GPT-5
#GPT-4.5
#写作prompt
#大词
#模型对比
分享
评论 0
0
nicekate
4周前
Manus 这篇文章非常出色,在我心中堪比 Anthropic 的《Building Effective Agents》。 为了更深入理解这篇文章,我让 AI 对其逐段进行翻译与解读,可视化呈现,并逐一研读。 最近,Manus 将它与 ChatGPT Agent 进行对比,并对后者进行了嘲笑。我认为这种评价有些欠妥。 毕竟 Manus 所使用的主要模型是 Claude,并非自研模型。 无论是在对比视频还是博文中,Manus 侧重的是可视化呈现,较少涉及深层次问题的严谨对照分析。
#Manus
#Claude
#ChatGPT Agent
#AI解读
#模型对比
分享
评论 0
0
dontbesilent
4周前
平时要养成同时用多个模型对比答案的习惯,平时我用 claude 和 gemini 多,今天用 cherry studio 对比了一下,发现竟然是 gpt 4.1 的效果最好 要是没有对比的话,试一下 gemini 2.5 pro 拿不到结果,估计就放弃了,错过机会
Google Gemini 2.5发布引发AI模型性价比热议· 97 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 327 条信息
#模型对比
#Gemini 2.5 Pro
#GPT 4.1
#Cherry Studio
#效果最佳
分享
评论 0
0
dontbesilent
1个月前
我想问一下,假如你们平时是只开了某一家的 AI 会员(比如 gemini gpt claude 三选一) 那做 agent 的时候怎么测试不同的模型? 我现在一套提示词,要用 claude 4 sonnet、gemini 2.5 pro、gpt 4.1 全都跑一遍,这似乎只有聚合平台才能实现呀
Google Gemini 2.5发布引发AI模型性价比热议· 97 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 327 条信息
#AI会员
#Agent测试
#模型对比
#聚合平台
#提示词
分享
评论 0
0
小互
1个月前
MiniMax 发布混合注意力推理开源模型 MiniMax-M1 训练成本仅为 53.5 万美元 性能超越Qwen3、DeepSeek-R1 逼近顶级闭源模型 MiniMax-M1引入了一种全新Lightning Attention 上下文优化注意力机制 相比 DeepSeek R1 等模型,在处理 10 万 tokens 的生成任务时,MiniMax-M1 的计算量仅为其 25%。 该模型基于前代模型 MiniMax-Text-01 开发,总参数规模为 4560亿,每个token激活参数为 45.9亿,支持最长 100万tokens 的上下文输入(约为 DeepSeek R1 的8倍)。 提出了一种新型强化学习算法 CISPO(Clipped Importance Sampling with Policy Optimization),该算法: 不裁剪 token 梯度,而是裁剪采样权重(importance weights)。 减少训练不稳定性,提升收敛质量。 缩短训练时长(Qwen2.5对比实验显示,训练速度提升2倍)
MiniMax M1发布:开源长上下文推理模型引发AI领域震动· 7 条信息
#MiniMax-M1
#开源模型
#Lightning Attention
#深度学习
#Qwen3
#DeepSeek-R1
#AI性能
#模型对比
#注意力机制
#上下文优化
分享
评论 0
0
karminski-牙医
4个月前
o3 和 o4-mini 数学和编程能力得分看评分应该是头部水平的,有的项目要超过 gemini-2.5-pro (目前编程最强)
#人工智能
#编程
#数学
#技术评估
#模型对比
分享
评论 0
0
Jintao Zhang 张晋涛
4个月前
这是什么意思呢?Anthropic 给自己的 API 加了个 OpenAI 的 API 兼容。这样就可以直接使用 OpenAI 的 SDK 了,以及在各类兼容 OpenAI API 接口的应用上来使用 Anthropic 的模型了。 原本还以为以后 LLM 的接口形式有两种,Anthropic 能硬扛压力,但这样看,以后应该就只有 OpenAI 这一种了
#Anthropic
#OpenAI
#API兼容
#LLM
#模型对比
分享
评论 0
0
李老师不是你老师
6个月前
阿里巴巴宣布新AI模型优于DeepSeek和Meta 阿里云表示,根据其进行的基准测试,Qwen2.5 Max与OpenAI、DeepSeek和Meta的领先模型进行了对比,Qwen2.5-Max全部超越了对比模型。
#阿里巴巴
#人工智能
#QWen2.5
#OpenAI
#模型对比
#技术突破
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞