karminski-牙医2025-04-04 07:37:00刚看到的侧面消息,Meta 的 AI 负责人已经离职了,可能是由于 llama-4 搞不出来 目前 llama-4 面临的压力我们来数一数,首先它肯定不能大于 120B,甚至最好还是维持在 70B,然后要超越 Qwen2.5-QwQ,Gemma3-27B 的水平,然后还要面临马上 Google 的新编码模型, DeepSeek-R2, Qwen-3 的冲击.... 不过我还是希望开源模型会多一
RFA 自由亞洲粵語2025-01-28 09:00:01本台深入調查發現,#DeepSeek 早在美國晶片禁令實施前,囤積大批Nvidia晶片,並利用Meta免費開放的「Llama」做研發同訓練。創辦人梁文鋒最近更成為中國總理李強座談會的座上客,反映與中共關係密切。 ➡️
阑夕2025-01-24 19:06:53一年前,也是在春节期间,OpenAI突然发布了断档领先的视频大模型Sora,给国产AI厂商添了大堵,被调侃为都过不好年了。 一年后的这次临近春节,轮到中国AI厂商给美国竞对们上眼药了,Qwen、DeepSeek、Kimi、Doubao连着发大招,你方唱罢我登场,实在热闹。 因为别人太强而过不好年,和因为自个忙起来根本就没想过好年,是完全不同的两码事。 字节跳动新发布的豆包1.5 Pro,除了
Michael Anti2024-12-27 14:40:16其实有了DeepSeek、Qwen这样开源的中国模型,更能避免敏感审查。这个有点颠覆大家的常识。实际上因为开源,所以你可以把引用任何推理云上的这些开源模型,如果有几万元余钱,你自己买GPU服务器放在你卧室(暖气可以省了),所以反而没有传统中美AI服务的审查问题。