时政
财经
科技
登录
#LoRA
关注
johann.GPT
2周前
最近研究 RAG 多了,很少关注微调,今儿看到一个不错的指南文章,分享一下对 LoRA 和 QLoRA 的理解: LoRA 通过分解权重更新矩阵为小矩阵来高效微调,大幅降低计算资源需求。QLoRA 在此基础上引入 4-bit 量化,结合高精度计算和低精度存储,进一步优化内存使用。两者都能在保持模型性能的同时显著降低训练成本。 特别有趣的是 QLoRA 的量化感知训练机制,通过 LoRA 适配器来补偿量化误差,实现了性能和效率的完美平衡。这些技术让企业能够更经济地部署定制化模型,是 LLM 落地的重要工具。 #AI #LLM #MachineLearning
#LoRA
#QLoRA
#微调
#模型压缩
#自然语言处理
分享
评论 0
0
karminski-牙医
1个月前
有人已经开始尝试把大模型装到玩具上了哈哈哈 看到个博主Complex-Indication使用树莓派 Zero 2 的摄像头采集图像,然后使用wifi上传到电脑,电脑使用 SmolVLM 来识别图像,再将控制命令传回去进行控制。不过刚开始完全不能运行,不过他用200张图微调了下模型,挂了个LoRA后,机器人就能走了! 他使用的 prompt 是这样的(我翻译成了中文):根据图像选择以下一项行动:前进,向左,向右,后退。若视野被障碍物阻挡,则选择后退。若左侧有障碍物,则选择向右。若右侧有障碍物,则选择向左。若没有障碍物,则选择前进。根据图像选择以下一项行动:前进,向左,向右,后退。若视野被障碍物阻挡,则选择后退。若左侧有障碍物,则选择向右。若右侧有障碍物,则选择向左。若没有障碍物,则选择前进。
#大模型
#玩具应用
#树莓派
#图像识别
#SmolVLM
#微调模型
#机器人控制
#LoRA
#机器学习
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞