特斯拉
GitHub
上线项目
Andrej Karpathy
前特斯拉AI总监Andrej Karpathy推出了一个名为“nanochat”的开源项目,旨在以极低的成本实现ChatGPT的训练与推理。该项目仅需100美元和一台云端GPU,用户可以在约4小时内训练出一个能够进行基础对话的小型ChatGPT。与以往需要数百万美元和复杂技术栈的训练方式相比,这一项目的推出大大降低了门槛,吸引了广泛关注。项目代码库仅有8000多行,包含完整的训练流程,发布后不到12小时便获得了超过4200个星标,显示出其受欢迎程度。
前特斯拉AI总监Karpathy推出开源项目"nanochat",仅用约8000行代码复现ChatGPT全流程。项目在GitHub上线不到12小时,星标数已破4.2k。 用户只需一台GPU、约4小时和100美元成本,就能训练出一个能写诗、回答基础问题的“小型ChatGPT"。 nanochat的主要功能 分词器训练:使用Rust语言实现训练分词器,负责将文本转换为符号码本序列。 预训练:在Fi
这个项目冲得好快,100刀就能买到最好的 ChatGPT。 一个极简但完整的全栈 ChatGPT 克隆项目,目标是在极低成本下实现端到端的训练与推理流水线。你只需要一台云端 GPU,通过一个脚本即可在短时间内跑通,体验到接近 ChatGPT 的对话体验。 不明觉厉
在以前想训练一个专属 ChatGPT,即便是小模型也动辄几百万美元,还要复杂的技术栈,让众人望而却步。 现在通过 nanochat 这个开源项目,只需 100 美元就能训练出一个完整的 ChatGPT,作者正是前特斯拉 AI 总监 Andrej Karpathy。 整个代码库只有 8000 多行、45 个文件,却实现了从分词、预训练、微调到推理的完整流程。 GitHub: 同时支持多种评估