#AI模型

3小时前

智谱AI推出的最新一代通用AI模型：GLM-4.6 代码能力提升了 27% 上下文扩展到200K 推理和写作能力提升全面适配国产芯片编码能力与Claude Sonnet 4 相比，GLM-4.6 有一定优势但在编程方面仍略逊于 Claude Sonnet 4.5

智谱直播发布全球最佳视觉模型GLM-4.5V，挑战AI视觉领域极限· 9 条信息

#智谱AI #GLM-4.6 #国产芯片 #AI模型 #代码能力提升

11小时前

🎉一觉醒来，Claude Code 又更新了，国庆期间刚好可以把玩 Sonnet 4.5 了最近这段时间用 Sonnet 4.0，感觉他写模板代码的能力确实强，但是对于理解我的意图以及修复问题还是有欠缺

AI编程工具激战：Claude Code、Gemini Cli崛起· 897 条信息

#Claude Code #Sonnet 4.5 #AI模型 #代码生成 #技术更新

歸藏(guizang.ai)

23小时前

Deepseek 又有更新，更新到了 3.2 Exp 主要的更新内容就是降价，再次降价超过 75%，输入输出都快要一样价格了，真离谱啊原因是实现了细粒度的超稀疏注意力机制，在不降低模型输出质量的前提下实现了训练推理成本的大幅下降

深度学习模型升级引发AI能力大跃进，行业迎新变革· 95 条信息

#DeepSeek #降价 #超稀疏注意力机制 #AI模型 #成本下降

1天前

DeepSeek V3.2发布了，果然逢过节必有版本模型地址：

深度学习模型升级引发AI能力大跃进，行业迎新变革· 95 条信息

#DeepSeek V3.2 #模型发布 #AI模型 #技术更新 #积极

1天前

google的AI Mode不支持中文

#Google #AI模型 #不支持中文

1天前

硅基流动新上 DeepSeek-V3.1-Terminus 听说 GLM-4.6 和 DeepSeek V3.2 也要来了不是说好国庆大家不要卷了嘛🤣

深度学习模型升级引发AI能力大跃进，行业迎新变革· 95 条信息

#DeepSeek-V3.1-Terminus #GLM-4.6 #DeepSeek V3.2 #AI模型 #国庆不卷

三秋十李 Sergio

1天前

分享一个白嫖 API Key 的小方法，虽然不多，一个月 5 美金，但也聊胜于无，那就是 Vercel AI Gateway，为开发使用每个月可以免费使用 5 美金的 api，涵盖 100 多个模型，使用起来也很方便。

#白嫖API Key #Vercel AI Gateway #免费API #AI模型 #省钱

6天前

中国正式跟英伟达决裂以后，阿里巴巴异军突起，全栈 #AI 基础设施和未来投资计划，全部浮出水面！ 1️⃣阿里巴巴在未来三年投入超过3800亿元人民币（530亿美元）用于开发人工智能模型和基础设施。 2️⃣阿里巴巴开发的新一代AI芯片目前已进入测试和小规模量产阶段，性能不输英伟达特供中国的H20阉割芯片。 3️⃣今天在云栖大会重磅发布的Qwen3-Max AI模型，包含开源原生全模态大模型0wen3-0mni，语音生成模型Owen3-TTS，图像编辑模型Qwen-Image-Edit-2509。重仓阿里巴巴，赌中国 #AI 国运，以及配套的芯片制造，中芯国际。超算IDC机房建造公司，万国数据。🧐

#阿里巴巴 #AI芯片 #Qwen3-Max #AI模型 #中国AI国运

1周前

Qwen3-Omni 不降智还超越，太牛了 Qwen3-Omni 技术报告写道： Qwen3-Omni-30B-A3B-Instruct 对比 Qwen3-235B-A22B 前者在 GPQA、AIME25、ZebraLogic、WritingBench 上超越后者更大的模型多模态训练反而提升了语言能力

#Qwen3-Omni #AI模型 #技术突破 #多模态训练 #性能超越

1周前

阿里发布一系列新模型： Qwen3-Omni Qwen-Image-Edit-2509 Qwen3-TTS（未开源）全面对标Gemini，太热闹了

Google Gemini 2.5发布引发AI模型性价比热议· 201 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 519 条信息

#阿里 #Qwen3-Omni #Gemini #AI模型 #科技

Jesse Lau 遁一子

1周前

GPT-5: 它还是个孩子体型：与成人上身长度接近，已达成年猎豹的身长级别（头体约 1.1–1.4 m）；但胸肩肌肉没完全“长实”，整体偏瘦长 → 常见于 12–24 个月。被毛特征：背部无幼崽银灰色“披风”（3–6 月龄最明显，最长到 ~8–9 月才消退）→ 明确已过幼年期。比例：四肢细长、头相对小，动作轻快，不见老年期常见的厚重与驼背 → 非老年。生长节律：猎豹 ~12 月龄已接近成体身长，18–24 月性成熟并开始“长肉”；2–3 岁完全成年。所以这只个体看起来刚“拉满身长、还在补肌肉”的阶段，最像 1–2 岁

#GPT-5 #AI模型 #年轻 #成长阶段 #猎豹

1周前

现在可以在 OpenRouter 上免费使用 Grok 4 Fast。

#Openrouter #Grok 4 Fast #免费 #AI模型 #技术

Tiger Chen & 前端之虎陈随易

1周前

用回Claude 4了，GPT 5卡得用不了。😂

AI编程工具激战：Claude Code、Gemini Cli崛起· 897 条信息

#Claude 4 #GPT 5 #AI模型 #使用体验 #技术对比

1周前

微软支持文档推出 #MCP 服务器，#AI 模型可以直接从 MCP 里获取微软最新的支持文档。Learn 网站包含微软多年来积累的庞大技术指南，以前 AI 模型需要搜寻和抓取页面，现在只需要与 MCP 服务器交互就可以获得最新的准确信息，帮助 AI 模型和开发者提高代码准确性。查看全文：

#微软 #MCP服务器 #AI模型 #技术指南 #代码准确性

歸藏(guizang.ai)

2周前

Claude 4.5 可能即将发布

AI编程工具激战：Claude Code、Gemini Cli崛起· 897 条信息

#Claude 4.5 #AI模型 #发布

2周前

Nano Banana厉害之处和潜在问题速度：平均生成时间2-4秒，比如部分基准测试生成一张1024px仅2.3秒。一致性：多次编辑，角色准确率高达95% 竞争表现：LMArena盲测，胜率达到70%，GenEval分数为0.89。优于Flux Kontext（45%胜率）和DALL-E 3（0.76 GenEval）效率：用先进的Token压缩技术，将图像数据压缩至约1300个，这是低价（0.04美元一张）高速的原因。文本渲染：在图像正确渲染文本，行业领先。提示词保真与编辑：多步骤提示词表现卓越，能对现有图像编辑且无需遮罩。场景完整性、光照和构图等异常出色。 ## 潜在问题可靠性问题：模型有时会无法执行Prompt，而直接返回原图，某些情况下失败率接近50% 。伪影与质量下降：模型有时会引入一层“轻微的模糊层”，降低图像的清晰度。 AI生成的常见问题也都有：手部变形等。尤其当主体物不处于中心位置或背景复杂时，图像质量可能会下降。特定弱点：尽管整体真实感出色，但处理精细面部特征时，与Qwen等竞对比，稍显逊色。

#nano banana #图像生成 #AI模型 #潜在问题 #速度快

2周前

这两个月deepseek v4得出来了吧？期待真的Claude平替。

深度学习模型升级引发AI能力大跃进，行业迎新变革· 95 条信息

#DeepSeek v4 #Claude平替 #AI模型 #技术期待 #竞品替代

2周前

豆包的新模型Seedream4.0太酷了，展示几个生图案例。案例1：生成蓝图玩偶上传Q版IP，输入提示词：参考图片的形象，以蓝图的风格制作Q版的玩偶，设计草图。并包括尺寸和解释性文本注释。应使用线条和测量值来指示各个部位的尺寸，给草图以技术和详细的感觉。除了主要设计外，还包括显示不同角度的零散缩略图，立体景深。

#豆包 #Seedream4.0 #AI模型 #蓝图玩偶 #技术草图

Jesse Lau 遁一子

2周前

gemini gem可以打开deep think

Google Gemini 2.5发布引发AI模型性价比热议· 201 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 519 条信息

#Gemini #DeepMind #AI模型 #技术进展

2周前

ModelScope魔搭 Qwen/Qwen3-Next-80B-A3B-Instruct 已经上线了，这是用它生成的天气卡片。

#ModelScope魔搭 #Qwen/Qwen3-Next-80B-A3B-Instruct #天气卡片 #AI模型 #技术进展

Jace Carter | UX UI

2周前

前几天给 Monica 发了邮件反馈 AI 模型上架不及时，最近一两个月发的模型都没上，很快就得到了回复。今天去看，上架了几个新的。发邮件反馈还是有用的。

#AI模型 #Monica #上架及时 #邮件反馈 #积极

歸藏(guizang.ai)

3周前

新神即将登基！即梦（Seedream）图片4.0 模型这个 ID保持和图像清晰度太吊了，无痛出你喜欢角色的 Cos 提示词在下面👇

AI视频井喷：Midjourney领跑，多模态混战· 179 条信息

#Seedream图片4.0 #AI模型 #图像清晰度 #cosplay #积极

4周前

AI 编程进入到了深水区，已经到了我不说清楚怎么写他就随便写了，感觉自己在给模型公司打工

OpenAI GPT-5发布引发用户不满，阿尔特曼回应质疑· 78 条信息

#AI编程 #深水区 #模型公司打工 #AI模型 #消极

1个月前

我需要做这样一个产品：模型方面用 gemini 2.5 pro（简称 G 模型）和 gpt o3（简称 O 模型）我问一个问题，之后 g 模型和 o 模型同时给我回答然后两个模型做互评，分别给对方的回答回复一个评价然后把它们两个的回答和这两个评价，也就是总共四个输出结果都放到上下文里面我还可以再基于这个上下文继续聊天有点复杂 …… 我感觉我自己用 AI 编程不太好实现而且 token 消耗会比较快，我问一个问题，大模型 API 至少要调4 次

#AI模型 #Gemini 2.5 Pro #GPT-o3 #模型互评 #Token消耗

1个月前

OpenRouter DeepSeek V3.1 (free) 来了

深度学习模型升级引发AI能力大跃进，行业迎新变革· 95 条信息

#Openrouter #DeepSeek V3.1 #免费 #AI模型 #技术