时政
财经
科技
虚拟货币
其他
登录
#国产大模型
关注
karminski-牙医
1周前
石锤! Windsurf 的新模型 SWE-1.5 更像 GLM-4.5! 之前网传硅谷的公司已经在内部开始大面积用国产开放权重大模型来魔改了, 传的尤其猛的是 Cursor 的 Composer-1 是用 DeepSeek 魔改(后训练或微调)的, 而 Windsurf 的 SWE-1.5 是用 GLM-4.6 魔改的. 而上一个基本已经石锤了, 这个还没有被验证, 于是给大家整个活, 看看这个模型从输出特征进行聚类, 更像哪个模型. 我魔改了 Slop-Forensics 分析了 SWE-1.5 和其它国产大模型的语言指纹, 结果出乎意料: 它与 GLM-4.5 聚类在同一分支,而非之前网传的 GLM-4.6! 考虑到一个模型想要效果好, 即使用其他的基座模型也要后训练一段时间, 所以的确更可能是 GLM-4.5 (7月28号发布), 而不是 GLM-4.6 (10月1号发布). 可惜了它没用 GLM-4.6 后训练哈哈哈, 我觉得以目前 GLM-4.6 作为基座模型后训练会比现在更猛, 或者是不是这样? SWE-1.5 对应 GLM-4.5, SWE-1.6 对应 GLM-4.6? 另外, Cerebras (即 Windsurf 这个 SWE-1.5 模型的云计算服务商), 决定将 GLM-4.6 作为默认推荐模型, 考虑到 GLM-4.6 在测试上的表现 (SWE-Bench 68%, LiveCodeBenchV6 82.8%), 我估计下一个模型用GLM-4.6概率就特别大了. 国产大模型牛皮! 顺便讲一下 Slop-Forensics 这个项目的原理: • 统计每个模型的词汇使用频率和短语重复模式 • 将这些"语言习惯"转化为特征向量 • 用聚类算法构建系统发育树,距离近=语言模式相似 就像指纹鉴定,不同模型即使输出相同内容,其底层的词汇偏好、短语组合方式会暴露出训练数据或架构的相似性. SWE-1.5 和 GLM-4.5 在树上紧密聚类,说明它们在: 高频词选择 二元/三元短语组合 词汇复杂度分布 这些维度上高度一致。这种相似性很难伪造——它根植于模型的深层结构中. 我魔改的版本: #智谱 #GLM #Cursor #windsurf #cerebras #国产大模型 #AI编程
智谱直播发布全球最佳视觉模型GLM-4.5V,挑战AI视觉领域极限· 19 条信息
#Windsurf SWE-1.5
#GLM-4.5魔改
#国产大模型
#语言指纹分析
#模型聚类
分享
评论 0
0
sitin
1周前
阿里Qwen3-Max上线,国产大模型又卷出新高度 先看硬实力: 1T+参数,36T tokens预训练 LMArena全球前三,超越GPT-5-Chat 推理版本数学满分,代码生成能力顶级 1M长上下文,Agent能力拉满 以前是"能不能用国产模型",现在是"哪些场景国产模型更好"。 代码、推理、长文本这几个方向,Qwen已经是第一梯队,成本还可能更低 API开了,建议实测。
MiniMax M1发布:开源长上下文推理模型引发AI领域震动· 23 条信息
#Qwen3-Max
#国产大模型
#1T参数
#LMArena全球前三
#代码推理长文本
分享
评论 0
0
Mr Panda
1周前
我注意到在英文时间线上,讨论国产大模型的推文越来越多
#国产大模型
#英文时间线
#讨论
#推文
分享
评论 0
0
𝙃𝘼𝙕𝙀𝙉𝙇𝙀𝙀
2周前
国产大模型Deepseek和Qianwen都实现了收益翻倍。 不幸的是GPT也对了几次, 这下糟糕了,连反指的作用都没有了。奥特曼彻底失败了。
AI交易比赛:DeepSeek V3领先,GPT-5惨遭亏损· 77 条信息
#国产大模型
#DeepSeek
#Qianwen
#GPT
#奥特曼失败
分享
评论 0
0
川沐|Trumoo🐮
2周前
从炒币实力证明,只有国产大模型遥遥领先 阿里通义千问,deepseek收益几乎翻倍, 海外被吹到爆炸的gpt和gemni快归零了, 老外号称数学最好的俩个模型claude和马斯克的grok4仅仅没亏保本.
AI交易比赛:DeepSeek V3领先,GPT-5惨遭亏损· 77 条信息
#国产大模型
#通义千问
#DeepSeek
#GPT/Gemini亏损
#Claude/Grok4保本
分享
评论 0
0
karminski-牙医
3周前
KAT-Coder-Pro-V1 实测! 早放3个月就好了? 给大家带来 kat coder pro v1 的测试结果: 首先, 所有的 three js 测试, 全都有包引用错误, 你所看到的所有演示都是我修了一次才能运行的画面. 大象牙膏测试中,三角烧瓶, 液面, 粒子建模的效果比较简陋, 泡沫没有实现逐渐变形并消失的效果, 光照效果也一般, 总体来说实现效果很简陋. 过山车测试, 同样是实现效果很简陋, 另外支撑柱的算法没有设计对, 还是穿模了. 鞭炮连锁爆炸测试, 亮点的地方是还是可以实现连锁爆炸的, 不过性能有很严重的问题, 特别卡 python 杯子倒水测试反而实现的很不错, prompt 中要求的效果基本都实现了. 总结: 前端性能目前看来一般, 大概是7月份那一波大模型的腰部水平, python 性能反而可圈可点. 建议继续打磨, 很高兴看到国产编码大模型又添一员. 早点放出来就好了呀! 这个性能在7月份是可以一战的! 另外, 官网演示还用了我7月份写的炸烟囱的 prompt, 但是这个 prompt 已经被我淘汰了, 因为现在头部大模型都能很轻松完成这个测试了. 建议换一些更复杂的体现模型性能. #katcoder #KCORES大模型竞技场
#KAT-Coder-Pro-V1测评
#编码大模型
#性能待提高
#Python表现良好
#国产大模型
分享
评论 0
0
Y11
5个月前
今天是2025年06月15日,简单说说今日通过 首页的观察: 1. 国产大模型在国内全面大爆发,各个环节都很缺人,大中小互联网厂游戏厂以及银行、保险、消费金融等公司随随便便就无限HC地招人,要求极低,工资很高。 2. 随着国产大模型的发展,文科生的就业可选择面大幅缩减,只有极少数公司还接受文学专业的人才(譬如设计故事的世界观、HRBP、平台运营、游戏中AGI故事线角色个性化设计、银行柜员),如果大家有机会,劝大家都转大模型(这东西很简单的,随便学几个prompt就能上岗了) 3. 从地理位置上看,北京、上海、广州、深圳还是吸纳人才最多的城市。再往后就是重庆、长沙、武汉、南京招人的岗位也多。想要转行的朋友可以多看看不同的城市,不要只在一个招聘软件找工作,以防信息茧房。 4. 即使大家都说外贸不好,但出海的人才也很缺。安克创新、海尔、以及新能源车企(如电动汽车、电动摩托车),都大量招人,各个细分领域的人才都要。对机械工业感兴趣的朋友不要错过。 虽然大家都喊着25年就业大环境不好,但是本质上还是有着极大的信息差。大部分人只知道那么几个老牌的招聘软件,因信息渠道被垄断而企业招不到人才,大家找不到工作,平台赚得盆满钵满。 以上信息,同样也适用于高考完毕正在选专业的家长和孩子,大家可以用的移动端里的‘问问’功能,输入孩子的个人偏好或者相关大学专业,然后系统就能给他提供特定的高考专业以及毕业后的就业去向,行业平均工资范围。毕竟大家都希望给孩子一个宽松好就业高薪的未来。
#国产大模型
#就业市场
#文科生
#人力资源
#高薪职位
分享
评论 0
0
央视网-央视网
8个月前
国产大模型加速迭代 开源渐成“必选项”
据艾瑞咨询研究院预测,到2028年,中国人工智能产业的规模有望达到8110亿元,人工智能和机器人等新兴产业将释放出巨大的市场潜力和发展空间。
#国产大模型
#开源
#人工智能
#科技创新
分享
评论 0
0
初码
9个月前
很多奥秘,没有那么复杂,耐心观察认真思考,答案往往很简单,大家对于DeepSeek等国产大模型的爆发很是吃惊,但其实只要留意到最近10年中国新增了多少衣食无忧的大学生、大厂哺育了多少财富惊人的架构师,你就知道,这些结果都是必然的。等哪天室温超导在中国的多个大学爆发诞生,也丝毫不要惊讶
#DeepSeek
#国产大模型
#室温超导
#大学生就业
#大厂架构师
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞