Gorden Sun
9小时前
nanochat:从零实现LLM训练和推理 Andrej Karpathy开源的项目,可以认为是一个极简版ChatGPT。包含8000 行代码,4小时、100美元训练成本,即可实现训练到微调全流程。 Github: 技术报告:
YL (Yucheng Liu)
10小时前
在AI领域,未来几年唯一重要的事情可能就是「上下文工程」(Context Engineering)。如何从嘈杂、非结构化的真实世界对话中精准提取、管理和排序上下文,再喂给LLM,是决定AI智能体表现的关键。这远比卷模型本身更有价值。
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
21小时前
LLM的改进方向 - 实现显性的价值模型 - 多目标优化 - 动态计算分配(根据情况在浅层和深层间切换) - 贝叶斯不确定性估计(知道何时不确定)