DeepSeek 发布开源第一弹!让大模型在GPU上跑得更快
2月24日,DeepSeek启动“开源周”,开源了首个代码库FlashMLA。
 
                Gorden Sun
7小时前
ChronoEdit-14B:英伟达开源的图片编辑模型 类似Nano Banana,但是效果差一些,人物一致性保持的还可以,但是语义理解不太行,比Kontext Dev强一些。 模型:
 
                Gorden Sun
7小时前
LLM训练手册 HuggingFace分享了他们训练SmolLM3-3B的详细操作步骤,200多页的文档。 地址:
 
                墙国蛙蛤蛤🐸(大自爆运动💣习近乎脑残粉🐻)
12小时前
Deepseek:总书记啥都学习近乎全能!