karminski-牙医2025-04-04 07:37:00刚看到的侧面消息,Meta 的 AI 负责人已经离职了,可能是由于 llama-4 搞不出来 目前 llama-4 面临的压力我们来数一数,首先它肯定不能大于 120B,甚至最好还是维持在 70B,然后要超越 Qwen2.5-QwQ,Gemma3-27B 的水平,然后还要面临马上 Google 的新编码模型, DeepSeek-R2, Qwen-3 的冲击.... 不过我还是希望开源模型会多一预览#Meta#AI#离职
Michael Anti2025-03-14 10:41:03Sam的百度嘴脸就漏出来的,给你丫免费用开源模型、主机可以放到你家地下室,啥他妈国家补贴和国家控制?一个闭源模型,竟然以安全理由禁止开源模型。没竞争,再英雄,人最终都会难看。#百度闭源#开源模型#国家补贴
karminski-牙医2025-03-13 05:05:47刚刚 Google 的开源模型 Gemma 3 发布了! 几个关键点: - 这次放出了pt(预训练,Pre-Training)和 it (指令微调,Instruction Tuning)版本,默认用it即可。pt更多是给大家用来微调用的基座模型 - Gemma-3 是多模态的,可以处理图片输入 - 大小分别是1B,4B,12B,27B - 支持 128K 上下文 - MMLU-Pro 评分,Ge预览预览12#Google#开源模型#多模态
小互2025-03-08 13:22:38Llama 4将在未来几周推出 据金融时报报道 Meta 计划在其最新的开源模型Llama 4 中引入改进的语音功能,预计将在未来几周内推出。 知情人士表示,Meta认为未来的 AI 驱动代理将以语音对话为主,而非以文本为主,他们将押注语音功能。 Meta可能正在改进其AI的语音理解功能,使其更准确地识别人类语音,提高交互体验。 使其更接近OpenAI的ChatGPT或Google Ass#Llama4#Meta#语音功能
人民网-新华网2025-03-02 06:20:00中国AI开源模型推动全球共享智能红利 新华社北京3月1日电 综述|中国AI开源模型推动全球共享智能红利 新华社记者 从工业革命到智能时代,进步的科学技术总是会激发人们共享人类文明成果的美好愿望,但技术垄断屡见不鲜,很多发展中国家难#中国AI#开源模型#智能红利
AIGCLINK2025-02-20 16:14:11西北工业大学开源了一个语音理解模型:OSUM,支持8种语音理解任务,从ASR到情感识别,以及语音到文本的深度理解 支持语音识别(ASR) 带时间戳的语音识别(SRWT) 声音事件检测(VED) 语音情感识别(SER) 说话风格识别(SSR) 说话者性别分类(SGC) 说话者年龄预测(SAP) 语音到文本对话(STTC) 它结合了Whisper和Qwen2,采用ASR+X训练策略,支持多任务同时#西北工业大学#OSUM#语音理解
环球网-中国新闻网2025-02-18 14:37:49OpenAI考虑开源某个模型?奥尔特曼在线发起投票综合报道,当地时间2月17日,美国开放人工智能研究中心(OpenAI)首席执行官萨姆·奥尔特曼在社交媒体平台上,就该公司下一个开源项目发起投票调查。#OpenAI#开源模型#奥尔特曼
Michael Anti2025-02-13 15:35:55我只有一个问题:百度的人会如实告诉他们老板其实文心一言从Day One开始就完全不如其他中国开源模型、而且每个月都在加大差距吗?难道非要被苹果辞退了,才知道自己模型不行吗?#百度#文心一言#开源模型
Gorden Sun2025-02-11 19:49:05FireRedASR:小红书开源的语音识别模型 支持识别普通话、方言、英文,分2个版本: FireRedASR-LLM:8.3B,为端到端的语音多模态LLM设计,能力更强,中文准确率开源最佳 FireRedASR-AED:1.1B,兼具效率和效果。 Github: 模型: #小红书#语音识别#开源模型
北美王路飞2025-01-31 13:52:42勃勃是浙大毕业在伯克利拿了物理学博士的高华,智力水平是不容质疑的。 可惜搞意识形态把脑子给搞坏了。 我能理解为什么钱学森能写出亩产万斤了。 学物理的一碰意识形态就容易降智, 勃勃每天号称手写的玩意还不如开源模型生产出来的语料垃圾🤣 谢谢大家!#勃勃#浙大#伯克利
新华网-新华网2025-01-28 14:33:51全球瞭望|英媒:DeepSeek最新开源模型将推动人工智能技术应用全球瞭望|英媒:DeepSeek最新开源模型将推动人工智能技术应用-#DeepSeek#开源模型#人工智能
-Zho-2025-01-28 00:57:40卧槽!!!DeepSeek 又直接发大招了!整上多模态大一统开源模型 Janus-Pro 系列了!!!卧槽了!!! 上一个开源多模态统一模型还是Emu3(10月21号左右),我发的测试原帖在: 模型(7B): 模型(1B): 等我过年期间写好JanusPro的插件和当时Emu3的插件一起发!#JanusPro#开源模型#多模态
小互2025-01-27 12:08:17阿里巴巴推出Qwen2.5-1M 支持100万Token上下文的开源模型,性能媲美GPT4o mini Qwen2.5-1M 在处理 超长文本任务 和 短文本任务 上都表现出了卓越的能力,尤其是在处理复杂的长上下文场景中,达到了开源模型的领先水平。 推理速度比传统方法快 3 到 7 倍,尤其在处理超长序列时表现优异。 推理阶段通过块状预填充(Chunked Prefill)技术,使显存需#阿里巴巴#Qwen2.5-1M#开源模型
Michael Anti2024-12-27 18:13:31今晚给10岁的小凯恩上算法课时,让他在常用AI中置顶新增DeepSeek v3,告诉他这是中国刚发布的开源模型。这次是做C++回溯算法题,有什么不懂的就让DeepSeek回答,他用得挺好。我说希望他以后成为像DeepSeek、Qwen里面的大哥哥们一样的AI程序员。男孩子需要榜样。#小凯恩#算法课#C++
Michael Anti2024-12-27 14:40:16其实有了DeepSeek、Qwen这样开源的中国模型,更能避免敏感审查。这个有点颠覆大家的常识。实际上因为开源,所以你可以把引用任何推理云上的这些开源模型,如果有几万元余钱,你自己买GPU服务器放在你卧室(暖气可以省了),所以反而没有传统中美AI服务的审查问题。#DeepSeek#Qwen#开源模型
阑夕2024-12-27 08:43:33这几天刷推很明显的感觉到英文技术社区对中国AI产业的进步速度处于一种半震动半懵逼的状态,应激来源主要是两个,一个是宇树(Unitree)的轮足式机器狗B2-W,另一个是开源MoE模型DeepSeek-V3。 宇树在早年基本上属于是波士顿动力的跟班,产品形态完全照猫画虎,商业上瞄准的也是低配平替生态位,没有太大的吸引力,但从B系列型号开始,宇树的机器狗就在灵活性上可以和波士顿动力平起平坐了。 B#中国AI#技术进步#宇树
宝玉2024-07-06 05:24:43李彦宏:开源模型是智商税,闭源模型更强大,推理成本更低 7月5日,2024世界人工智能大会(WAIC 2024)期间,百度创始人、董事长兼首席执行官李彦宏接受采访时表示,开源其实是一种智商税。“当你理性地去想,大模型能够带来什么价值,以什么样的成本带来价值的时候,就会发现,你永远应该选择闭源模型。今天无论是ChatGPT、还是文心一言等闭源模型,一定比开源模型更强大,推理成本更低。”#李彦宏#开源模型#闭源模型