Skip to content

LichAmnesia/llm-engineering-handbook

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

llm-engineering-handbook

构建生产级 AI 副本(LLM Twin)的完整教程

作者:LichAmnesia | 2026


为什么有这本书?

市面上讲大语言模型(LLM)的教程要么停在 prompt engineering,要么一上来就是 Transformer 数学推导,中间那段——如何把一个原型拼成真正可上线、可维护、可扩展的系统——被跳过了。

这本书只讲那段。

我把自己过去两年构建"LLM Twin"(AI 副本)过程里踩过的坑、权衡过的方案、最后跑到生产的架构,压成 10 章。每章都可以独立跟着动手做,连起来读,是一套完整的 FTI(Feature–Training–Inference)管线实现。

读完你能自己搭出:一个用你本人数据微调、用 RAG 增强、可以部署到云上、能持续评估和监控的个人 AI 副本。


目录

Part I · 地基(Why & What)

Part II · 数据(Feature Pipeline)

Part III · 训练(Training Pipeline)

Part IV · 推理(Inference Pipeline)

Part V · 上线(LLMOps)

附录


怎么读这本书

你是 建议路径
第一次做 LLM 项目的工程师 按顺序读完 10 章,跟着每章末尾的"动手做"任务实现
已经在做 RAG,想提升生产级能力 跳过 Ch1-Ch4,直接从 Ch7 开始,回头补 Ch5-Ch6
只想了解架构决策逻辑 读 Ch2、Ch9、Ch10,再挑感兴趣的章节细看
想做代码落地 每章末尾都有 repo 里对应目录,fork 就能跑

约定

  • 代码:Python 3.11+。所有示例可在 Apple Silicon / Linux 下跑。
  • 术语:技术术语首次出现时给中英文双标(如"微调(fine-tuning)")。
  • 引用:括号里带原始论文/文档链接,不用脚注。
  • 免责:生产部署前请根据自己的业务场景二次评估;书中的默认参数是起点,不是终点。

许可证

内容:CC BY-NC 4.0。代码:MIT。转载请注明出处。

About

构建生产级 AI 副本教程

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors