#代码模型

5个月前

试了三小时 KAT-Coder-Pro-V1，感觉没法用来当主力 vibe coding 模型，主要因为： 1. 在 Claude Code 里经常干一半就不动了，有点呆萌... 2. 在 Zed 里多次干出空文件 3. 在一个纯英文项目里，纯英文提示词的情况下，混入了中文单词 4. 很难一次做对的样子，但已经消耗了 500 多万 tokens 以上可能都是因为我个人使用姿势不当？

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#KAT-Coder-Pro-V1 #代码模型 #Claude Code #Zed #Tokens

5个月前

KAT-Coder-Pro：快手的代码专用模型之前快手开源了代码模型KAT-Coder-Air，现在推出了能力更强的商业化版本：KAT-Coder-Pro，代码能力更强，256K上下文，可以无缝接入Claude Code、Cline、Kilo Code等工具。新用户送2000万token。使用地址：领取免费token：

#快手 #代码模型 #KAT-Coder-Pro #256K上下文 #商业化

7个月前

打算卸Cursor了，模型都是Claude Sonnet 4，最近改了不少东西，基本上都是牛头不对马嘴。还是Claude Code好用

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#Cursor #Claude Sonnet 4 #Claude Code #失望 #代码模型

8个月前

刚刚，阿里开源了其最强代码模型：Qwen3-Coder-480B-A35B-Instruct，性能媲美Claude Sonnet4 480B参数，激活参数35B，MoE，原生支持 256K上下文，通过YaRN可扩展到1M 超强代码、Agent能力另外，还有一个Qwen Code，基于Gemini CLI修改的CLI工具，用来增强Qwen3‑Coder系列模型的解析器和工具支持 #Qwen3Coder #代码模型

#Qwen3-Coder #代码模型 #开源 #256K上下文 #Agent能力

9个月前

其实 SWE Agent 好不好用主要还是看用的什么模型，因为现在写代码基本上只能用 claude-sonnet-4 模型，这也是为什么 claude code 突然这么火的最最最根本的原因！因为 claude code 可以无情地使用它自己家的 claude，但是 Cursor 就没有这个优势了，对于 Cline 和 avante.nvim 这种 BYOK 的 SWE Agent 的情况就更加糟糕了，因为有很多人在 BYOK 的产品上面甚至用 GPT 这种垃圾模型来写代码，最后得到垃圾的结果导致对 Cline 和 avante.nvim 印象很差，其实本质原因是使用的大模型太垃圾了，注意我的措辞，现在做 SWE Agent 「只能」用 claude-sonnet-4，只能！

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#SWE Agent #claude-sonnet-4 #代码模型 #Claude Code #BYOK

9个月前

Gergely Orosz: 除了谷歌之外，还有哪家大型公司**没有**把Sonnet作为他们主要的代码模型吗？我听说，甚至连Meta公司都已经从Llama内部转用了Sonnet！ Anthropic的确创造了一个不可思议的奇迹：如今大部分科技公司编程时默认使用的模型居然都是他们家的。令人特别意外的是，Meta居然发现：即使是专门用自家代码库微调训练过的Llama模型，效果仍然不如**未经任何微调的Sonnet**好！这可是Meta啊！拥有如此强大的资源，又立志打造业界顶级的模型，现在却还得乖乖向Anthropic付费（至少目前是这样）。但仔细想想，Sonnet的确很特别。从Sonnet 3.5开始，它一直都是业界编程领域的绝对领先者，甩开其他模型一大截。当然，现在其他模型也逐渐追了上来，但Sonnet的主攻方向和优势似乎一直都聚焦在**编程领域**？ > 我觉得关键还是专注。 > Anthropic明显将精力集中在技术和编程领域，而其他模型往往既想做通用用途，又想兼顾编程任务。 > -- Chris Sommers 另外，传统企业中有个很过时的观念：他们担心用Sonnet这样的模型会导致**隐私泄漏**。其实根本不会，只要用像AWS Bedrock这种服务，就能确保数据不会被传出，根本不存在隐私问题！

#谷歌 #Meta #sonnet #llama #代码模型 #Anthropic #科技公司