#Llama4

6天前

Unsloth Studio 本地微调大模型一直有两个痛点：VRAM 不够、配置太复杂。 Unsloth Studio 这周上线 Beta，两个都解决了： • 开源 no-code Web UI，点点鼠标就能微调 • VRAM 占用减少 70%（一张 RTX 3090 就能调 7B 模型） • 速度比 HuggingFace 原生快 2 倍 • 支持 Llama 4、Qwen 2.5/3.5 等最新架构 • 训练完一键导出 GGUF/vLLM/HuggingFace 格式 • Windows 和 Linux 本地运行，不碰云端 r/LocalLLaMA 上反响炸裂。对个人开发者和小团队来说，这可能是目前门槛最低的微调方案。不用花钱买 SaaS 了，自己练一个专属模型比你想的简单。 🔗

#UnslothStudio #微调大模型 #VRAM优化 #no-code #WebUI #RTX3090 #HuggingFace #Llama4 #Qwen

1年前

Llama 4将在未来几周推出据金融时报报道 Meta 计划在其最新的开源模型Llama 4 中引入改进的语音功能，预计将在未来几周内推出。知情人士表示，Meta认为未来的 AI 驱动代理将以语音对话为主，而非以文本为主，他们将押注语音功能。 Meta可能正在改进其AI的语音理解功能，使其更准确地识别人类语音，提高交互体验。使其更接近OpenAI的ChatGPT或Google Assistant，并集成更多语音控制功能。 Meta可能计划将语音AI应用于社交媒体，如Facebook、Instagram和WhatsApp，使用户可以通过语音命令完成更多任务。例如： - 自动回复消息：AI可以根据上下文自动回复WhatsApp或Messenger中的信息。 - 内容推荐：根据用户的兴趣，智能推送内容，如视频、新闻或广告。 - 虚拟助手功能：如预订餐厅、设置提醒、安排会议等。据之前报道Llama 4 Mini 已完成预训练，Llama 4模型仍在训练中。Meta 可能在未来几周内发布初步结果或技术演示。

#Llama4 #Meta #语音功能 #AI技术 #开源模型

karminski-牙医

1年前

LLama-4 或许会在4月底之前发布？昨天的消息，meta搞了个 llamaCon 大会，预计在4月29号召开，感觉4月底前应该就能发llama-4了？要不然感觉也没啥可con的.... 地址：

#Llama4 #Meta #发布会 #AI

1年前

今天在匿名职场社区teamblind上的一个meta员工发的匿名帖子特别火：《Meta genai org in panic mode》 Meta 的生成式 AI 团队陷入了恐慌状态。这一切的开端是 DeepSeek V3 的推出，这让 Llama 4 在各项基准测试中全面落后。更让人雪上加霜的是，一家“未知的中国公司”用仅 550 万美元的预算完成了训练，直接打脸了现有的大型模型。目前，工程师们正在疯狂拆解 DeepSeek，试图复制其中的一切。我不是在夸张，事情就是这么紧迫。管理层也在焦虑如何为生成式 AI 团队的高昂成本向高层交代。尤其是，当团队中每一位所谓的“领导者”拿到的薪水都远远超过了训练整个 DeepSeek V3 的成本，而这样的“领导者”团队却有数十人之多。 DeepSeek R1 的出现更是雪上加霜。虽然有些信息还不能透露，但很快就会公开，到时候情况可能更加不利。本来，这个团队应该是一个以工程为核心的小型组织，但因为一些人想借机刷存在感、抢占资源，人为地扩大了团队规模，结果反而让大家都成了输家。

#Meta #生成式AI #DeepSeekV3 #Llama4 #基准测试 #中国公司 #大型模型 #预算 #团队恐慌