时政
财经
科技
虚拟货币
其他
登录
#Llama4
关注
sitin
6天前
Unsloth Studio 本地微调大模型一直有两个痛点:VRAM 不够、配置太复杂。 Unsloth Studio 这周上线 Beta,两个都解决了: • 开源 no-code Web UI,点点鼠标就能微调 • VRAM 占用减少 70%(一张 RTX 3090 就能调 7B 模型) • 速度比 HuggingFace 原生快 2 倍 • 支持 Llama 4、Qwen 2.5/3.5 等最新架构 • 训练完一键导出 GGUF/vLLM/HuggingFace 格式 • Windows 和 Linux 本地运行,不碰云端 r/LocalLLaMA 上反响炸裂。对个人开发者和小团队来说,这可能是目前门槛最低的微调方案。 不用花钱买 SaaS 了,自己练一个专属模型比你想的简单。 🔗
#UnslothStudio
#微调大模型
#VRAM优化
#no-code
#WebUI
#RTX3090
#HuggingFace
#Llama4
#Qwen
分享
评论 0
0
小互
1年前
Llama 4将在未来几周推出 据金融时报报道 Meta 计划在其最新的开源模型Llama 4 中引入改进的语音功能,预计将在未来几周内推出。 知情人士表示,Meta认为未来的 AI 驱动代理将以语音对话为主,而非以文本为主,他们将押注语音功能。 Meta可能正在改进其AI的语音理解功能,使其更准确地识别人类语音,提高交互体验。 使其更接近OpenAI的ChatGPT或Google Assistant,并集成更多语音控制功能。 Meta可能计划将语音AI应用于社交媒体,如Facebook、Instagram和WhatsApp,使用户可以通过语音命令完成更多任务。 例如: - 自动回复消息:AI可以根据上下文自动回复WhatsApp或Messenger中的信息。 - 内容推荐:根据用户的兴趣,智能推送内容,如视频、新闻或广告。 - 虚拟助手功能:如预订餐厅、设置提醒、安排会议等。 据之前报道Llama 4 Mini 已完成预训练,Llama 4模型仍在训练中。Meta 可能在未来几周内发布初步结果或技术演示。
#Llama4
#Meta
#语音功能
#AI技术
#开源模型
分享
评论 0
0
karminski-牙医
1年前
LLama-4 或许会在4月底之前发布? 昨天的消息,meta搞了个 llamaCon 大会,预计在4月29号召开,感觉4月底前应该就能发llama-4了?要不然感觉也没啥可con的.... 地址:
#Llama4
#Meta
#发布会
#AI
分享
评论 0
0
宝玉
1年前
今天在匿名职场社区teamblind上的一个meta员工发的匿名帖子特别火:《Meta genai org in panic mode》 Meta 的生成式 AI 团队陷入了恐慌状态。 这一切的开端是 DeepSeek V3 的推出,这让 Llama 4 在各项基准测试中全面落后。更让人雪上加霜的是,一家“未知的中国公司”用仅 550 万美元的预算完成了训练,直接打脸了现有的大型模型。 目前,工程师们正在疯狂拆解 DeepSeek,试图复制其中的一切。我不是在夸张,事情就是这么紧迫。 管理层也在焦虑如何为生成式 AI 团队的高昂成本向高层交代。尤其是,当团队中每一位所谓的“领导者”拿到的薪水都远远超过了训练整个 DeepSeek V3 的成本,而这样的“领导者”团队却有数十人之多。 DeepSeek R1 的出现更是雪上加霜。虽然有些信息还不能透露,但很快就会公开,到时候情况可能更加不利。 本来,这个团队应该是一个以工程为核心的小型组织,但因为一些人想借机刷存在感、抢占资源,人为地扩大了团队规模,结果反而让大家都成了输家。
#Meta
#生成式AI
#DeepSeekV3
#Llama4
#基准测试
#中国公司
#大型模型
#预算
#团队恐慌
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞