Learn MiniMind

从零基础到面试通关 —— 24节课 + 190道面试题 + 哆啦A梦图解，彻底搞懂大语言模型

快速开始 • 课程目录 • 面试宝典 • 学习路线图 • 漫画图解 • 多格式输出

这个项目是什么？

用 24 节课 + 190 道面试八股文 + 15 张哆啦A梦漫画图解，把一个完全零基础的小白，带到能在面试中自信讲述"我从零训练了一个大语言模型"的水平。

MiniMind 是一个仅需 3 块钱、2 小时就能从零训练出 64M 参数 GPT 的开源项目，在 GitHub 上获得了 45k+ Star。本仓库是 MiniMind 的系统化学习教程 + 面试备战手册，专为以下人群设计：

零基础小白 —— 不懂 Python、不懂深度学习也能看懂，配有哆啦A梦漫画图解
求职面试者 —— 190+ 道面试八股文 + STAR 面试稿 + 简历撰写指南
想动手实践 —— 每节课都有可运行的 PyTorch 实验代码

本项目的特色

特色	说明
190+ 面试题	覆盖 Transformer 深度拷问、训练全流程、推理优化、工程实践、MiniMind 专属追问
STAR 面试稿	30秒/1分钟/3分钟自我介绍 + 7 个技术难点 STAR 应对 + 12 轮模拟面试
简历撰写指南	4 种详略版本 + 4 个岗位方向调整 + 6 组普通/优化写法对比
哆啦A梦漫画	15 张原创漫画，用生动形象的方式解释核心概念
源码深度解析	7 门核心课程增加源码逐行解读 + 动手实验 + 面试考点
多格式输出	Markdown / HTML / PDF 三种格式，随时随地学习

学习路线图

你现在在这里
    ↓
Phase 1                    Phase 2                    Phase 3                    Phase 4                 Phase 5
零基础入门                 模型核心组件               训练全流程                 高级特性 & 面试          求职冲刺
============              ==============             ============              ================        ============

L01 什么是LLM         →   L05 Tokenizer分词器    →   L11 数据处理流水线    →   L17 DPO偏好优化     →  L23 简历撰写指南
 |                         |                          |                         |                       |
L02 Transformer全景    →   L06 词嵌入Embedding    →   L12 预训练Pretrain    →   L18 PPO/GRPO强化学习 →  L24 STAR面试法
 |                         |                          |                         |
L03 PyTorch快速上手    →   L07 RMSNorm归一化      →   L13 监督微调SFT       →   L19 MoE混合专家
 |                         |                          |                         |
L04 MiniMind环境搭建   →   L08 RoPE位置编码       →   L14 LoRA高效微调      →   L20 推理优化
                           |                          |                         |
                           L09 注意力机制&GQA      →   L15 知识蒸馏KD         →   L21 部署与应用
                           |                          |                         |
                           L10 FFN前馈网络&SwiGLU  →   L16 完整模型组装       →   L22 面试通关指南
                                                                                    ↓
                                                                           190+ 面试八股文
                                                                                    ↓
                                                                              写进简历，拿下Offer！

学习时间估算

路径	时长	适合人群	达成目标
快速通关	3 天	有深度学习基础	面试能讲清项目，刷完核心面试题
系统学习	7 天	有 Python 基础	深入理解每个模块，完成所有动手实验
从零开始	14 天	完全零基础	手撕代码 + 面试通关 + 简历完善

3 天快速通关路线

天数	学习内容	重点
Day 1	L01-L04（入门）+ L09（Attention）+ L12（预训练）	理解整体架构和训练流程
Day 2	L13（SFT）+ L17（DPO）+ L14（LoRA）+ 面试题 06-08	掌握训练全链路和核心面试题
Day 3	L23（简历）+ L24（STAR 面试稿）+ 面试题 10	简历撰写 + 面试模拟

7 天系统学习路线

天数	学习内容
Day 1	L01-L04：基础概念 + 环境搭建
Day 2	L05-L07：Tokenizer + Embedding + RMSNorm
Day 3	L08-L10：RoPE + Attention/GQA + FFN/SwiGLU
Day 4	L11-L13：数据处理 + 预训练 + SFT
Day 5	L14-L16：LoRA + 知识蒸馏 + 模型组装
Day 6	L17-L22：DPO/PPO + MoE + 推理优化 + 部署
Day 7	L23-L24 + 面试题 06-10：简历 + STAR 面试 + 全部八股文

课程目录

Phase 1 · 零基础入门

从"大语言模型是什么"开始，到亲手跑通 MiniMind

课程	主题	格言	预计时长
L01	什么是大语言模型	"大道至简，从文字接龙说起"	30min
L02	Transformer 全景图	"注意力就是一切"	45min
L03	PyTorch 快速上手	"工欲善其事，必先利其器"	60min
L04	MiniMind 项目导览与环境搭建	"千里之行，始于配环境"	30min

Phase 2 · 模型核心组件

逐个拆解 Transformer 的每一个"零件"，对应 MiniMind 源码，配有哆啦A梦漫画图解

课程	主题	格言	预计时长	漫画
L05	Tokenizer 分词器	"模型的第一本字典"	45min	图解
L06	词嵌入 Embedding	"把文字变成数字的魔法"	30min	图解
L07	RMSNorm 归一化	"训练稳定的守护者"	40min	图解
L08	RoPE 旋转位置编码	"让模型知道谁先谁后"	50min	图解
L09	注意力机制 & GQA	"每个词都在关注其他词"	60min	图解
L10	前馈网络 FFN & SwiGLU	"知识的仓库，智慧的门控"	40min	图解

Phase 3 · 训练全流程

从数据到模型训练的完整链路，亲手训出属于你的 LLM

课程	主题	格言	预计时长	漫画
L11	数据处理流水线	"数据是模型的食粮"	45min
L12	预训练 Pretrain	"让模型学会词语接龙"	60min	图解
L13	有监督微调 SFT	"从百科全书到对话助手"	50min	图解
L14	LoRA 参数高效微调	"四两拨千斤的微调艺术"	50min	图解
L15	知识蒸馏 KD	"青出于蓝而胜于蓝"	40min
L16	Transformer Block → 完整模型	"乐高积木拼出飞机"	60min

Phase 4 · 高级特性与面试通关

强化学习、MoE、部署优化，以及最终的面试通关指南

课程	主题	格言	预计时长	漫画
L17	DPO 直接偏好优化	"教模型分辨好与坏"	50min	图解
L18	PPO / GRPO 强化学习	"在试错中持续进化"	60min
L19	MoE 混合专家模型	"术业有专攻"	50min	图解
L20	推理优化 KV-Cache & YaRN	"又快又好地生成"	45min	图解
L21	模型部署与应用	"从实验室走向生产"	45min
L22	面试通关指南	"把项目写进简历，拿下Offer"	90min

Phase 5 · 求职冲刺

简历撰写 + STAR 面试法，直接用于求职

课程	主题	内容	预计时长
L23	MiniMind 项目简历撰写	4 种详略模板 + 6 组对比 + 4 岗位调整 + 避坑指南	60min
L24	STAR 面试法完整稿	自我介绍模板 + 7 场景 STAR 应对 + 12 轮模拟面试	90min

面试宝典

共 190+ 道面试题，覆盖 MiniMind 项目的每一个技术细节

基础面试

专题	内容	题量
项目介绍话术	30秒/1分钟/3分钟版本的项目介绍模板	3 套
模型架构面试题	Transformer、GQA、RoPE、RMSNorm...	28 题
训练流程面试题	Pretrain、SFT、LoRA、DPO、PPO...	30+ 题
优化与部署面试题	KV-Cache、MoE、量化、推理加速...	20+ 题
综合追问与深挖题	面试官最喜欢追问的高难度问题	15+ 题

深度面试八股文（新增）

专题	内容	题量	特色
Transformer 深度拷问	Self-Attention、RoPE、RMSNorm、SwiGLU...	30 题	每题含数学推导
训练全流程面试	Pretrain→SFT→LoRA→DPO→PPO→GRPO→MoE	50 题	PO 统一框架
推理优化与部署	KV Cache、Flash Attention、量化、vLLM...	30 题	显存精确计算
工程实践面试	AMP、梯度累积、DDP、checkpoint...	30 题	含代码实现
MiniMind 项目专属	针对 MiniMind 的全方位项目追问	50 题	含 STAR 示例

面试速查表

面试场景	推荐阅读
自我介绍	01-项目介绍话术 → L24-STAR面试稿
简历撰写	L23-简历撰写指南
架构原理	02-模型架构 → 06-Transformer深度拷问
训练流程	03-训练流程 → 07-训练全流程50题
推理部署	04-优化部署 → 08-推理优化30题
工程实践	09-工程实践30题
项目深挖	05-综合追问 → 10-MiniMind专属50题
手撕代码	10-Q46~Q48（Self-Attention / RoPE / LoRA 手写）

哆啦A梦图解

15 张原创漫画，让复杂概念变得生动有趣

概念	漫画	说明
LLM 全景		哆啦A梦从口袋掏出 Transformer 各组件
Tokenizer		大雄把句子切成小积木，BPE 合并过程
Embedding		词语在向量空间中的星星
RMSNorm		标准化光线枪让数据统一
RoPE		旋转木马上的位置编码
Self-Attention		同学们互相传纸条
GQA		MHA vs MQA vs GQA 三种方案对比
SwiGLU		门控开关选择信息通过
预训练		哆啦A梦在图书馆读海量书籍
SFT		大雄教哆啦A梦礼貌说话
DPO		选择好的回答，拒绝坏的回答
LoRA		只改一小部分的"效率道具"
MoE		多个专家小叮当各司其职
KV Cache		记忆面包不用重复背
训练流程		从零到一的冒险地图

快速开始

# 1. 克隆本学习仓库
git clone https://github.com/bcefghj/learn-minimind.git
cd learn-minimind

# 2. 克隆 MiniMind 原项目（学习时需要对照源码）
git clone https://github.com/jingyaogong/minimind.git
cd minimind && pip install -r requirements.txt

# 3. 从第一课开始
# 打开 docs/L01-什么是大语言模型.md 开始学习！

生成 HTML 版本

pip install markdown pygments
python scripts/build_html.py
# 打开 dist/html/index.html 查看

生成 PDF 版本

pip install markdown weasyprint
python scripts/build_pdf.py
# 查看 dist/pdf/ 目录

项目结构

learn-minimind/
│
├── README.md                          ← 你在这里
│
├── docs/                              ← 24 节课程（核心内容）
│   ├── L01-什么是大语言模型.md
│   ├── ...
│   ├── L22-面试通关指南.md
│   ├── L23-简历撰写指南.md            ← 新增：简历撰写
│   └── L24-STAR面试法完整稿.md         ← 新增：STAR 面试
│
├── interview/                         ← 面试宝典（10 篇，190+ 题）
│   ├── 01-项目介绍话术.md
│   ├── ...
│   ├── 05-综合追问与深挖题.md
│   ├── 06-Transformer深度拷问30题.md   ← 新增
│   ├── 07-训练全流程面试50题.md        ← 新增
│   ├── 08-推理优化与部署面试30题.md    ← 新增
│   ├── 09-工程实践面试30题.md          ← 新增
│   └── 10-MiniMind项目专属面试50题.md  ← 新增
│
├── assets/comics/                     ← 哆啦A梦风格漫画（15 张）
│   ├── 01-llm-overview.png
│   ├── ...
│   └── 15-training-pipeline.png
│
├── scripts/                           ← 工具脚本
│   ├── build_html.py                  ← Markdown → HTML
│   └── build_pdf.py                   ← Markdown → PDF
│
├── dist/                              ← 生成的多格式输出
│   ├── html/                          ← HTML 版本
│   └── pdf/                           ← PDF 版本
│
├── web/                               ← 交互式学习网站（Next.js）
│   ├── src/components/
│   └── package.json
│
└── LICENSE                            ← MIT

交互式学习网站

本项目包含一个基于 Next.js + Framer Motion 的交互式学习网站，包含：

代码打字机动画 — Transformer Block 源码逐字打出 + 语法高亮
Token 数据流动画 — 直观看到输入→Tokenizer→Embedding→Transformer→输出的全过程
学习路径卡片 — 24 节课滚动入场动画
模型架构交互图 — 可展开/折叠的 Transformer Block 可视化
模拟面试动画 — 面试官提问、你来回答的对话循环

cd web && npm install && npm run dev   # http://localhost:3000

路径	说明
`/`	首页：动画 + 学习路径卡片（点击卡片进入讲义）
`/learn`	24 节课目录
`/lesson/L01` … `/lesson/L24`	单课全文
`/interview`	面试宝典目录
`/interview/01` … `/interview/10`	面试文档

MiniMind 项目速览

指标	数值
参数量	64M（GPT-3 的 1/2700）
训练成本	≈ ¥3（单卡 3090）
训练时间	≈ 2 小时
GitHub Stars	45k+
核心架构	Decoder-Only Transformer（对齐 Qwen3）
关键技术	GQA(8Q/4KV)、RoPE(theta=1e6)、RMSNorm、SwiGLU
训练全链路	Tokenizer → Pretrain → SFT → LoRA → DPO → PPO/GRPO → MoE → Tool Call → 蒸馏

参考资源

官方资源

MiniMind 原项目 — GitHub 45k+ Stars
MiniMind Wiki — 官方学习文档
MiniMind 在线体验 — ModelScope Demo

优质学习仓库

MiniMind-in-Depth — 源码深度解读（880 stars）
breakdown-minimind — 交互式 Notebook 拆解（148 stars）
MLNLP-World/minimind-notes — 社区详细中文注释版（128 stars）
joyehuang/minimind-notes — 原理与实践指南（86 stars）
tomatoyuan/minimind-learn — 从零复现实践（230 stars）

面试资源

博客教程

多格式输出

格式	说明	生成方式
Markdown	GitHub 直接阅读（主格式）	直接访问 `docs/` 和 `interview/`
HTML	带样式的网页版，支持首页导航	`python scripts/build_html.py`
PDF	可打印的 PDF 版本	`python scripts/build_pdf.py`
Web	交互式学习网站	`cd web && npm run dev`

License

MIT

大道至简 —— 从零开始，一步一步，你也能训练自己的大语言模型。
Star 这个仓库，开始你的 LLM 学习之旅吧！

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
assets/comics		assets/comics
docs		docs
interview		interview
scripts		scripts
web		web
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md

Folders and files

Latest commit

History

Repository files navigation

Learn MiniMind

这个项目是什么？

本项目的特色

学习路线图

学习时间估算

3 天快速通关路线

7 天系统学习路线

课程目录

Phase 1 · 零基础入门

Phase 2 · 模型核心组件

Phase 3 · 训练全流程

Phase 4 · 高级特性与面试通关

Phase 5 · 求职冲刺

面试宝典

基础面试

深度面试八股文（新增）

面试速查表

哆啦A梦图解

快速开始

生成 HTML 版本

生成 PDF 版本

项目结构

交互式学习网站

MiniMind 项目速览

参考资源

官方资源

优质学习仓库

面试资源

博客教程

多格式输出

License

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages