Lazy loaded image
🔱Huggingface 出品的 LLM 训练手册
Words 121Read Time 1 min
2025-11-1
2025-11-1
type
status
date
slug
summary
tags
category
icon
password
网址
Huggingface 出品的 LLM 训练手册
非常详细的介绍了完整的 LLM 训练流程,包括训练指南(是否需要预训练)、预训练、后训练、基础设施
主要以他们自己训练的 SmolLM3 这个 3B 模型为例子
文章或者说手册包含了他们训练模型过程中对一系列决策、发现和死胡同的梳理,全是实践经验
notion image
 
上一篇
下一篇
《大语言模型的强化学习》课程,配套 PPT 和视频可以免费学习

Comments
Loading...