马东锡 NLP
3天前
今天在 huggingface 上看到了 VibeThinker-1.5B,来自微博 AI。 这个名字熟悉又陌生。才意识到,拥有巨量数据的微博,在 AI 领域不是掉队的问题,是似乎毫无存在感。
Michael Anti
1周前
一个很喜欢的小众私人训练的70B的LLM,从Openrouter撤下了,再看只有Huggingface上有,而且没云推理支持(如果自己部署要10美元/小时)。非常惋惜,只能以后买AI机器的时候,本地部署了。
Gorden Sun
2周前
LLM训练手册 HuggingFace分享了他们训练SmolLM3-3B的详细操作步骤,200多页的文档。 地址: