AI Engineer Roadmap

Dành cho Software Engineer bị overwhelm với quá nhiều keyword AI. Lộ trình này giúp bạn biết học gì, theo thứ tự nào, và bỏ qua cái gì.

Vấn đề

Bạn là Software Engineer. Bạn đọc Twitter, LinkedIn, Hacker News — và mỗi ngày có thêm 10 keyword mới ném vào mặt: RAG, fine-tuning, embedding, vector DB, agent, MCP, tool calling, prompt engineering, chain-of-thought, RLHF, LoRA, distillation...

Mỗi cái đều nghe quan trọng. Nhưng không ai nói cho bạn thứ tự nào đúng, cái nào thật sự cần cho công việc, và cái nào chỉ là noise.

Giải pháp

Lộ trình này chia thành 3 phase, mỗi phase trả lời một câu hỏi trung tâm:

Phase	Câu hỏi trung tâm	Chapters
1 — Hiểu con dao	LLM là gì, làm được gì, giới hạn ở đâu?	Ch.1–2
2 — Kỹ thuật cốt lõi	Làm sao output ổn định, kết nối thế giới thật, chạy pipeline?	Ch.3–5
3 — Ship Agent	Agent loop hoạt động thế nào?	Ch.6

Cách sử dụng

Mỗi chapter có cấu trúc:

Concept — lý thuyết cốt lõi, giải thích bằng góc nhìn engineer
Code Lab — ví dụ chạy được, copy-paste vào terminal
Checkpoint — câu hỏi tự kiểm tra trước khi sang chapter tiếp
Đọc thêm — link tài liệu gốc cho ai muốn đào sâu

Nguyên tắc #1

Không cần hiểu hết mới được đi tiếp. Mỗi chapter được thiết kế để bạn nắm đủ 80% rồi move on. Phần 20% còn lại sẽ tự rõ khi bạn thực hành ở chapter sau.

Prerequisite

Biết code Python cơ bản (function, class, pip install)
Có terminal và editor (VS Code)
Có API key từ OpenAI hoặc Anthropic (hướng dẫn ở Chapter 1)

Bản đồ nhanh — Keyword nào thuộc nhóm nào

Trước khi bắt đầu, nắm sơ đồ này để không bị lạc:

Nhóm	Keyword	Bạn cần khi nào
Dùng LLM (focus chính)	prompt engineering, tool calling, MCP, agent, function calling, structured output, CoT, few-shot	Ngay bây giờ
Context & Memory (module sau)	RAG, embedding, vector DB, chunking, reranking	Sau khi ship agent đầu tiên
Huấn luyện model	fine-tuning, LoRA, RLHF, DPO, distillation	Khi bài toán cụ thể yêu cầu
Hạ tầng ML	MLOps, model serving, GPU infra	Khác role hoàn toàn

90% công việc AI Engineer application nằm ở 2 nhóm đầu. Lộ trình này cover nhóm 1. Nhóm 2 (RAG, memory) sẽ là module tiếp theo.

Sẵn sàng? Bắt đầu từ Chapter 1 — LLM Foundations →

Vấn đề​

Giải pháp​

Cách sử dụng​

Prerequisite​

Bản đồ nhanh — Keyword nào thuộc nhóm nào​

Vấn đề

Giải pháp

Cách sử dụng

Prerequisite

Bản đồ nhanh — Keyword nào thuộc nhóm nào