时政
财经
科技
虚拟货币
其他
登录
#代码模型
关注
AIGCLINK
3周前
刚刚,阿里开源了其最强代码模型:Qwen3-Coder-480B-A35B-Instruct,性能媲美Claude Sonnet4 480B参数,激活参数35B,MoE, 原生支持 256K上下文,通过YaRN可扩展到1M 超强代码、Agent能力 另外,还有一个Qwen Code,基于Gemini CLI修改的CLI工具,用来增强Qwen3‑Coder系列模型的解析器和工具支持 #Qwen3Coder #代码模型
#Qwen3-Coder
#代码模型
#开源
#256K上下文
#Agent能力
分享
评论 0
0
宝玉
1个月前
Gergely Orosz: 除了谷歌之外,还有哪家大型公司**没有**把Sonnet作为他们主要的代码模型吗? 我听说,甚至连Meta公司都已经从Llama内部转用了Sonnet! Anthropic的确创造了一个不可思议的奇迹:如今大部分科技公司编程时默认使用的模型居然都是他们家的。 令人特别意外的是,Meta居然发现: 即使是专门用自家代码库微调训练过的Llama模型,效果仍然不如**未经任何微调的Sonnet**好! 这可是Meta啊!拥有如此强大的资源,又立志打造业界顶级的模型,现在却还得乖乖向Anthropic付费(至少目前是这样)。 但仔细想想,Sonnet的确很特别。从Sonnet 3.5开始,它一直都是业界编程领域的绝对领先者,甩开其他模型一大截。 当然,现在其他模型也逐渐追了上来,但Sonnet的主攻方向和优势似乎一直都聚焦在**编程领域**? > 我觉得关键还是专注。 > Anthropic明显将精力集中在技术和编程领域,而其他模型往往既想做通用用途,又想兼顾编程任务。 > -- Chris Sommers 另外,传统企业中有个很过时的观念:他们担心用Sonnet这样的模型会导致**隐私泄漏**。 其实根本不会,只要用像AWS Bedrock这种服务,就能确保数据不会被传出,根本不存在隐私问题!
#谷歌
#Meta
#sonnet
#llama
#代码模型
#Anthropic
#科技公司
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞