AI Engineer Roadmap
Dành cho Software Engineer bị overwhelm với quá nhiều keyword AI. Lộ trình này giúp bạn biết học gì, theo thứ tự nào, và bỏ qua cái gì.
Vấn đề
Bạn là Software Engineer. Bạn đọc Twitter, LinkedIn, Hacker News — và mỗi ngày có thêm 10 keyword mới ném vào mặt: RAG, fine-tuning, embedding, vector DB, agent, MCP, tool calling, prompt engineering, chain-of-thought, RLHF, LoRA, distillation...
Mỗi cái đều nghe quan trọng. Nhưng không ai nói cho bạn thứ tự nào đúng, cái nào thật sự cần cho công việc, và cái nào chỉ là noise.
Giải pháp
Lộ trình này chia thành 3 phase, mỗi phase trả lời một câu hỏi trung tâm:
| Phase | Câu hỏi trung tâm | Chapters |
|---|---|---|
| 1 — Hiểu con dao | LLM là gì, làm được gì, giới hạn ở đâu? | Ch.1–2 |
| 2 — Kỹ thuật cốt lõi | Làm sao output ổn định, kết nối thế giới thật, chạy pipeline? | Ch.3–5 |
| 3 — Ship Agent | Agent loop hoạt động thế nào? | Ch.6 |
Cách sử dụng
Mỗi chapter có cấu trúc:
- Concept — lý thuyết cốt lõi, giải thích bằng góc nhìn engineer
- Code Lab — ví dụ chạy được, copy-paste vào terminal
- Checkpoint — câu hỏi tự kiểm tra trước khi sang chapter tiếp
- Đọc thêm — link tài liệu gốc cho ai muốn đào sâu
Không cần hiểu hết mới được đi tiếp. Mỗi chapter được thiết kế để bạn nắm đủ 80% rồi move on. Phần 20% còn lại sẽ tự rõ khi bạn thực hành ở chapter sau.
Prerequisite
- Biết code Python cơ bản (function, class,
pip install) - Có terminal và editor (VS Code)
- Có API key từ OpenAI hoặc Anthropic (hướng dẫn ở Chapter 1)
Bản đồ nhanh — Keyword nào thuộc nhóm nào
Trước khi bắt đầu, nắm sơ đồ này để không bị lạc:
| Nhóm | Keyword | Bạn cần khi nào |
|---|---|---|
| Dùng LLM (focus chính) | prompt engineering, tool calling, MCP, agent, function calling, structured output, CoT, few-shot | Ngay bây giờ |
| Context & Memory (module sau) | RAG, embedding, vector DB, chunking, reranking | Sau khi ship agent đầu tiên |
| Huấn luyện model | fine-tuning, LoRA, RLHF, DPO, distillation | Khi bài toán cụ thể yêu cầu |
| Hạ tầng ML | MLOps, model serving, GPU infra | Khác role hoàn toàn |
90% công việc AI Engineer application nằm ở 2 nhóm đầu. Lộ trình này cover nhóm 1. Nhóm 2 (RAG, memory) sẽ là module tiếp theo.
Sẵn sàng? Bắt đầu từ Chapter 1 — LLM Foundations →