时政
财经
科技
虚拟货币
其他
登录
#Karpathy
关注
Sanbu
2天前
是不是觉得 karpathy 的 autoresearch 很酷?又看到一个类似的自动化工具:ArgusBot。 本质是一个 7*24 小时循环迭代任务 的科研执行系统。它可以让任务持续进行,实时汇报进展、接受指令。 我自己平时做科研/工程时,经常会遇到需要反复盯进度的问题,有了这个方便很多。
#Karpathy
#autoresearch
#ArgusBot
#自动化工具
#科研执行系统
#实时汇报
#科研进展
分享
评论 0
0
nash_su - e/acc
5天前
提升240倍!😱 AI 连续工作1天2夜帮我把一个算法模型准确度提高了240倍,这太震撼了! 前天下午,我用karpathy 大神的 autoresearch 的思路,编写了一个 program.md 文档,在一个GTX4090单卡机器上,让 Claude Code 按照文档要求帮我优化一个AI预测模型。 当天就提升了24%,但是后续一直没有明显进步,直到昨晚,我用 /btw 给他说要大胆一些不要约束在当前思路,可以从底层修改。 结果就在刚刚,完成了240倍的突破,AI 重构了模型架构,直接把 MSE 降低了240倍。 1天两夜,将近48小时的连续运行,自己做了快70个实验,太震撼了
#AI
#算法优化
#Claude Code
#GTX4090
#Karpathy
#autoresearch
#程序文档
分享
评论 0
0
程序员老熊
1周前
GitHub 上爆火的 NanoClaw 彻底刷屏, 更安全、更精简的 OpenClaw“容器版”。 有了 NanoClaw ,可以不再让你的 AI 代理在系统里裸奔了,也不用担心它悄悄给你拆家了。 🥒默认全容器化运行!Agent 所有的操作都被关在“沙箱”里。想删我根目录?门儿都没有! 🫛代码仅 4000 行: 极简主义巅峰。代码少意味着漏洞少、易审计。Karpathy 说这代码量“人脑和 AI 都能秒懂”,这才是优雅的工程实践。 🥑大厂背书: 基于 Anthropic 的 Agent SDK 深度优化,速度快、稳定性强,开源社区反响极热。 我试了一下,非常简单。感觉不需要去腾讯云大楼下面排队找人安装了。
#NanoClaw
#OpenClaw
#容器化
#AI安全
#Karpathy
分享
评论 0
0
howie.serious
3个月前
karpathy 的“LLM 议会”,把全人工流程的“llm 专家团”/“llm 三人行”提升了一个高度! - 先是 n 个llm 独自答题; - 然后分别peer review,每个人给所有人打分; - 最后由“议会主席”(gemini 3.0 pro)总结发言。 在我以前的实践中,第二第三步是自己人脑执行的。和kaparthy 这种全自动化的方式还是有差异。 例如,我自己的判断是gemini 3.0 pro 的回答更好(依据是作为思想实验的启发性)。而ai 的判断是 gpt-5.1 更好(更多聚焦于问题本身)。 karpathy vide coding 出来的这个 app 很好,只要配置一个 openrouter key 就可以立刻跑起来。 期待的更新:分享功能。 不足:太费钱了。这几个llm 会员我都有啊,完全可以有一个chrome extension,用会员的额度来做这件事,而不要单独用 api 烧钱🤣 (独立开发者们?)
#LLM议会
#Karpathy
#Gemini 3.0 Pro
#GPT-5.1
#AI评估
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
4个月前
结合最近强化学习之父Sutton提到LLM is a dead end和硅谷AI好老师Andrej Karpathy在访谈提到RL is terrible; 让我不禁想起在LLM的训练范式中,RL可能并不适合LLM这种纯符号计算,Sutton的担心是悬浮的符号计算会走向何方?Karpathy离职从事AI教育志向在于探索LLM的cognitive core如何为AI时代的人类所用。 LLM的"世界" = 符号空间 但符号空间是: - 自我指涉的(符号定义符号) - 无物理后果的(删除token无痛感) - 无生存压力的(错误不导致死亡) ∴ RL在此"空转": 优化的是"符号游戏的得分" 而非"在世界中生存"
#LLM
#强化学习
#Sutton
#Karpathy
#符号计算
分享
评论 0
0
sitin
5个月前
前特斯拉AI总监Karpathy推出开源项目"nanochat",仅用约8000行代码复现ChatGPT全流程。项目在GitHub上线不到12小时,星标数已破4.2k。 用户只需一台GPU、约4小时和100美元成本,就能训练出一个能写诗、回答基础问题的“小型ChatGPT"。 nanochat的主要功能 分词器训练:使用Rust语言实现训练分词器,负责将文本转换为符号码本序列。 预训练:在FineWeb数据集上对Transformer架构的大语言模型进行预训练,并通过CORE指标评估模型性能。 中期训练:在SmolTalk用户-助手对话数据集、多项选择题数据集、工具使用数据集上进行中期训练,使模型适应对话场景。 监督微调(SFT):在世界知识多项选择题数据集(ARC-E/C、MMLU)、数学数据集(GSM8K)、代码数据集(HumanEval)上进行监督微调,提升模型在特定任务上的表现。 强化学习微调(RL):使用“GRPO”算法在GSM8K数据集上对模型进行强化学习微调,进一步优化模型性能。 推理部署:实现高效模型推理,支持KV缓存、简易预填充/解码流程、工具使用(轻量级沙箱环境中的Python解释器),并通过CLI或类ChatGPT的WebUI与模型交互。 成绩单生成:生成单一的Markdown格式报告卡,总结整个训练推理流程,并以“游戏化”形式展示结果。 Github仓库:
前特斯拉AI总监推出100美元ChatGPT克隆项目引发热议· 5 条信息
#Karpathy
#nanochat
#开源项目
#ChatGPT复现
#AI
分享
评论 0
0
Gorden Sun
5个月前
nanochat:从零实现LLM训练和推理 Andrej Karpathy开源的项目,可以认为是一个极简版ChatGPT。包含8000 行代码,4小时、100美元训练成本,即可实现训练到微调全流程。 Github: 技术报告:
#nanochat
#LLM
#ChatGPT
#Karpathy
#开源
分享
评论 0
0
0xWizard
6个月前
学习 ai 一定先看 karpathy 这个视频,讲的非常清晰,这就是真懂的人。 附了一张网友做的思维导图。 怕链接有问题的,直接去b站搜 karpathy,然后看3.5小时时长那个就是了。
#AI学习
#Karpathy
#B站
#思维导图
#推荐
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞