响马
0 关注者
qwen 对英文 prompt 理解很不好,说明它不是 llama 再训练。
李萌萌
4周前
稍微更新了一下自己的知识库,把chatbox换成了cherry studio(因为可以自己调参) 打算横评一下qwen和openai的embedding model 然后把jina整合进workflow里 美妙
宝玉
1个月前
Gergely Orosz: 除了谷歌之外,还有哪家大型公司**没有**把Sonnet作为他们主要的代码模型吗? 我听说,甚至连Meta公司都已经从Llama内部转用了Sonnet! Anthropic的确创造了一个不可思议的奇迹:如今大部分科技公司编程时默认使用的模型居然都是他们家的。 令人特别意外的是,Meta居然发现: 即使是专门用自家代码库微调训练过的Llama模型,效果仍然不如*
勃勃OC
彭博社消息:Meta 正在洽谈向 Scale AI 投资超 100 亿美元 Meta 可能会向 Scale AI 投入超过 100 亿美元,这将是其迄今最大的一笔外部 AI 投资,目标是将 Llama 打造成全球 AI 标准。Scale AI 目前估值约 250 亿美元,是 AI 模型训练的关键公司。该交易还将加深两家公司在国防技术领域的合作关系。
AI Will
订阅乱象... 这就是为什么我们需要开源模型来对大AI实验室施加压力。 deepseek和qwen可能不是最好的——但如果没有开源竞争,gemini和openAI就不会提供这么多免费的东西。 另外,openAI什么时候发布开源权重模型? 来自:Haider.
Lex Tang
下一个 Vibe Coding 项目坚决不能再用 TCA 了,因为大部分模型对它的语法和周边库理解不够,时不时会陷入 AI 写错代码,我教它正确用法的漩涡