#Qwen

1个月前

Qwen 的模型哪怕是最强的 Qwen3-Max 也不是今天才发布，怎么千问 App 突然就效果特别好了呢。好难猜啊。

深度学习模型升级引发AI能力大跃进，行业迎新变革· 143 条信息

#Qwen #Qwen3-Max #千问App #模型效果 #猜测

A股证券交易员

1个月前

最近几周，一种微妙的变化变得越来越明显。过去几个月来一直流传着低成本的、开源的中国人工智能模型可能会将全球用户从美国产品中吸引走的猜测。但现在看来，它们也在悄悄地赢得硅谷的青睐。风险投资家查玛斯·帕利哈皮蒂亚最近在他的有影响力的《全力以赴》播客上——由白宫人工智能负责人大卫·萨克斯共同主持——表示，他合作的一家公司已经将主要工作负载转移给了北京 Moonshot AI 开发的 Kimi K2。他说，这个开源模型“坦白说比 OpenAI 和 Anthropic 便宜得多。” 不久之后，爱彼迎公司首席执行官布莱恩·切斯基承认，他没有将他的旅行应用与 OpenAI 的 ChatGPT 集成，因为连接工具还没“完全准备好”。切斯基表示，爱彼迎的新服务代理依赖于十多种不同的 AI 模型，他们“很大程度上”依赖于阿里巴巴集团的 Qwen 系列：“它非常好。它也很快速且便宜。”考虑到切斯基与 OpenAI 首席执行官萨姆·奥特曼的密切个人关系，他的评论尤其引人注目。公开承认的名单正在不断增长。由 OpenAI 前首席技术官 Mira Murati 创立的 Thinking Machines Lab 在博客文章中表示，其最新研究灵感来源于并建立在阿里巴巴 Qwen3 团队的工作之上。但可能更有趣的是这种转变似乎正在以更微妙的方式扎根。备受瞩目的 AI 编程领导者 Cursor，一家估值约 100 亿美元的科技公司，上个月发布了其助手的新版本。此后，互联网上开始流传一种说法，称其是基于像 DeepSeek 这样的中国 AI 工具构建的，一位科技投资者在 X 平台上指出，在他使用该工具时，其内部对话切换到了普通话。另一家估值约 100 亿美元的美国公司 Cognition AI Inc.，似乎也是基于智谱 AI（国际名为）的基础模型构建了其新的编程代理。在社交媒体侦探发布相关怀疑后，这家北京-based 公司似乎在一篇推文中确认了他们的发现，称其“突出了开源贡献对生态系统的积极影响和价值”。这两家美国公司没有立即回复我发去的评论请求。但中国 AI 模型的宽松许可性质意味着公司可以自由在其上构建产品。由支持开源 AI 的美国联盟项目整理的 Hugging Face 平台数据显示证实了这一点。中国模型在开发者累计下载量方面已超过美国。这一转变起初缓慢，随后突然发生：2024 年初，Meta Platforms Inc.的 Llama 有 1060 万次下载，而阿里巴巴 Qwen 仅有 50 万次。到上个月，Qwen 的累计下载量已达 3853 万次，相比之下 Llama 为 3462 万次。基于 Qwen 构建的衍生系统现在占 Hugging Face 上发布的新语言模型的 40%以上，而 Meta 的份额已降至 15%。

#中国AI模型 #硅谷 #开源 #Qwen #AI

1个月前

任何电子设备在小朋友手里都能玩出花来他们果然是新时代的弄潮儿在把我的boox送给我儿子后，今天惊奇的发现他在里面用qwen查资料🥶🥶🥶

#电子设备 #小朋友 #新时代 #Qwen #查资料

1个月前

k2 glm qwen m2 国产模型势头强劲啊

#K2 #GLM #Qwen #M2 #国产模型

1个月前

中国的做法，其实让市场竞争变得更加激烈。一个产品的利润，往往来自几个部分——软件，以及硬件的租赁。在过去，美国的科技公司利润主要来自软件，硬件租赁只是小头。而从边际成本来看，软件的成本要低得多。软件靠什么赚钱？靠算法和工程实现。比如，OpenAI 是最早发现通过强化学习（RL，比如 GPRO）可以产生“涌现”现象的公司，然后他们悄悄地把这一技术用于自家产品。从商业角度看，这是完全合理的做法——既降低了成本，又提升了效果，还能与竞争对手拉开差距，提高自家模型的“token 内在价值”，缩短盈利周期。这就像打游戏一样，OpenAI 打开宝箱抽出了一把 AK47，而其他玩家手里还拿着砍刀。但搅局者出现了——DeepSeek 发布了一系列论文，开源了模型，相当于直接给所有玩家都发了一把 AK47。最近，DeepSeek 又推出了 DeepSeek OCR，在极低成本下实现高效识别，计算量可降低 90%。这项技术谷歌可能也早已掌握，但 DeepSeek 却直接“发给大家一枚 RPG 火箭筒”。结果就是，其他玩家的盈利之路变得更加艰难。那为什么 OpenAI、Gemini 等公司不怎么开源？因为一旦开源，就会削弱它们在 AI 软件领域的利润空间。那中国企业为什么要这样做？因为它们在这个领域中是“追赶者”，开源能削弱领跑者的优势，有利于它们在合适的时机实现反超。而在中国的开源模型中，表现最突出的就是阿里推出的 Qwen。阿里本身就有硬件租赁和云计算平台业务，因此在 Qwen 上投入研发，是一笔算得过的账。

#中国 #市场竞争 #开源 #DeepSeek #Qwen

2个月前

最近做交易一直亏钱？看看本世纪的人类智慧结晶们，你会发现它们一样亏... 是不是好受一点了？之前领跑的DeepSeek和Qwen都出现了巨大回撤，而其他大模型都亏的差不多了... 比较有趣的是垫底的Gemini最近居然在赚钱？

AI交易比赛：DeepSeek V3领先，GPT-5惨遭亏损· 98 条信息

#大模型 #亏钱 #Gemini #DeepSeek #Qwen

Jesse Lau 遁一子

2个月前

总算刷到Qwen咋进场了😃

#Qwen #模型 #AI #积极

Jesse Lau 遁一子

2个月前

Qwen主要是如何退出完全是不透明的，所以对其之前的控制回撤也搞不清其到底是有一个合理控制逻辑，还是随机平仓按其当前多单的退出计划，invalidation condition是完全无效的

#Qwen #多单 #退出计划 #不透明 #无效

Crypto_PainterⓂ️Ⓜ️T

2个月前

几个AI大模型目前在BTC上的表现，看的出来：Qwen算是短线高手，回撤稍大，但收益率最高... Deepseek稍微稳一些，维持正向盈利的同时，回撤要比Qwen低一些，剩下的几个模型就很有意思了：Grok与Claude算是跟上了小级别趋势，但问题出在了无法控制回撤... Gemini和GPT就是来送钱的... 感觉这大概率会是一个新赛道，等年底玩完了，下个目标就是去部署一套AI交易模型了... 看了一些教程，似乎人为变量都集中在“提示词”上，参数层面可操作的部分不是很多，而且门槛估计比较高，因此可以得出一个结论：文科生的量化时代要来了！

AI交易比赛：DeepSeek V3领先，GPT-5惨遭亏损· 98 条信息

#AI交易模型 #BTC #Qwen #DeepSeek #文科生量化

2个月前

以后股市有问题可以前去QWEN和DeepSeek问。chatgpt就算了。

DeepSeek数据泄露：德国下架，信任崩盘· 446 条信息

中国DeepSeek引发美国科技股暴跌事件· 170 条信息

#Qwen #DeepSeek #股市 #ChatGPT

2个月前

大模型公司下场卷业务卷生态，Qwen 加把劲啊

#大模型 #Qwen #业务生态 #行业竞争 #技术发展

2个月前

看来还是CLI 好做，阿里光Claude Code 竞品就由三个团队分别做了三个。 iFlow CLI、Qwen CLI、Qoder CLI。

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#CLI #阿里 #Qwen #iFlow #Qoder

karminski-牙医

2个月前

收手吧阿问，外面全是你家大模型了.... 📷 所以下周要发的是 Qwen3.1 系列还是 Qwen-Image 更新还是啥... #qwen

深度学习模型升级引发AI能力大跃进，行业迎新变革· 143 条信息

#Qwen #大模型 #阿问 #qwen3.1 #图像更新

3个月前

如果你每天过脑子的大部分信息关键词是 #qwen #openaipulse #claudecode #open #pce #nfp #XAUUSD 之类的， #jet2holidays 这样洗整个欧美的脑已经好几个月的关键词都没听说过，我只能说：兄弟，歇会儿。

#Qwen #openaipulse #ClaudeCode #open #PCE #NFP #XAUUSD #jet2holidays

3个月前

分享《🧠 世界上覆盖最全的优秀Qwen提示语大全，欢迎贡献你的提示词》，总有一款适合你！ Share "🧠 The world's most comprehensive collection of excellent Qwen prompts, welcome to contribute your prompts", there is always one that suits you!

#Qwen #提示语 #开源 #AI #中文

3个月前

BABA 的选筹实在是毫无难度啊，淘天值半个拼多多，qwen 值 1/4 个 Anthropic，阿里云值 1/4 个 AWS，四舍五入简直白给，港股中概除了世纪互联这种 MEME 股简直没有更好的标的了。好在我年初 150 就早早埋伏了。

#baba #淘天 #Qwen #阿里云 #港股 #中概股 #价值洼地 #长期投资

3个月前

因为Vibe，我把一些小项目做了，一个就是自己翻译epub（原来我是Calibre转后用DeepL翻的），但现在改成20线程Deepseek+Qwen翻译，做的效果让我感动死了，最新的周恩来英文传记，翻译之后，我压根不觉得是英文写的（竟然大段大段引用周恩来中文原文），不知道要比DeepL高多少（当然，速度没DeepL快）。

深度学习模型升级引发AI能力大跃进，行业迎新变革· 143 条信息

#vibe #DeepSeek #Qwen #周恩来英文传记 #翻译质量高

4个月前

CLI 太多了，仅凭技术难以脱颖而出，出来混是讲势力，要有背景，新入局者若想吸引用户，学学 Qwen 给免费的 qwen3-coder-plus 以展现诚意，或拿出足够颠覆性的产品。 Nanocoder

#CLI #Qwen #Nanocoder #技术 #免费

4个月前

m3-agent：带记忆的智能体字节开源的智能体，能把多模态数据也转化成记忆，包括文本、音频、图片、视频数据。分别微调了2个模型用于记忆和执行，记忆模型基于Qwen 2.5 omni，执行模型基于Qwen 3 32B。 Github：

#m3-agent #智能体 #字节跳动 #开源 #Qwen

4个月前

Qwen在其论文中提到使用1328像素分辨率的数据进行训练，1328p是即梦在1:1画幅下的默认出图分辨率，应该仅仅是个巧合。

#Qwen #1328像素分辨率 #即梦 #巧合 #AI模型

4个月前

Qwen 发福利了，除了魔搭每天免费 2000次的调用还享受每天 2000 次请求 Qwen Code 免费运行（完整 Coder 模型）算了下，现在我的电脑里已经有了 7 龙珠了 Claude Code opencode Gemini CLI Cursor CLI Qwen CLI Augment CLI Warp Codex 还没尝试苦恼的是每家都有些特定的规则、命令，快捷方式也会有些不同，脑子不够用啦

#Qwen #魔搭 #免费调用 #Coder模型 #AI工具

4个月前

原来hugging face有个外号叫qwen s3 bucket🤣

#Hugging Face #Qwen #S3 Bucket #外号 #调侃

4个月前

昆仑万维推出并开源全新推理大模型Skywork Mindlink，基于Qwen3-32B和Qwen2.5-72B后训练而成。节省了大量训练成本，同时显著增强了基础模型能力。模型采用新的推理范式Plan-based Reasoning，去掉了“think"标签，能根据任务难度自适应整合推理和非推理生成回复，降低推理成本且提升多轮对话能力。 Skywork MindLink 模型在 10 个在无外接工具配置的大模型评测对比中，在人类最后的考试（Humanity's Last Exam）评测中获得第一，在复杂的数学领域（奥赛）中拿下 4 项评测第一（USAMO 2025、AIME 2024、AIME 2025、 HMMT 2025），在通识类领域的 GPQA-diamond 和 MMLU-pro 评测也表现优异。

#昆仑万维 #Skywork Mindlink #推理大模型 #Qwen #AI评测第一

4个月前

Qwen这满满的Seedream味😂

#Qwen #Seedream #模仿 #幽默 #AI

4个月前

2025年7月绝对可以被称为，中国大模型的「安卓时刻」。就像 iPhone 改变了世界，但安卓真正普及了新时代体验。国产大模型 Kimi Qwen GLM连续一个月开源一系列模型，悄无声息地完成了「规模对等」「性能对齐」「成本反杀」的三连击。 Kimi K2 是 1T 参数 MoE 架构；Kimi-K2 与 GLM-4.5 能够在 Claude Code 运行并完成复杂软件开发。Qwen3-Coder 也在 openrouter 编程用量榜单排到第二。过去 AI 编程几乎只有 Claude 一个选择，完全不存在性价比平替，但在7月之后，局面被完全改变。好几家 AI 编程产品如 Cursor，Windsurf 以极快的时间上线了 Kimi 和 Qwen。这是一种「安卓时刻」的重演：不是因为硬件超越，而是因为足够便宜、足够好用、足够自由。不再需要巨头模型的 API 许可，就可以构建自己的全流程 Coding Agent；不再需要受制于欧美定价，可以自行托管运行专属的代码引擎。将超级 AI 的权力普惠化，并不是要打倒谁，而是给出另一个普世的选择。

#中国大模型 #Kimi #Qwen #开源 #AI编程