Chuyển tới nội dung chính

AI Engineer Roadmap

Dành cho Software Engineer bị overwhelm với quá nhiều keyword AI. Lộ trình này giúp bạn biết học gì, theo thứ tự nào, và bỏ qua cái gì.


Vấn đề

Bạn là Software Engineer. Bạn đọc Twitter, LinkedIn, Hacker News — và mỗi ngày có thêm 10 keyword mới ném vào mặt: RAG, fine-tuning, embedding, vector DB, agent, MCP, tool calling, prompt engineering, chain-of-thought, RLHF, LoRA, distillation...

Mỗi cái đều nghe quan trọng. Nhưng không ai nói cho bạn thứ tự nào đúng, cái nào thật sự cần cho công việc, và cái nào chỉ là noise.

Giải pháp

Lộ trình này chia thành 3 phase, mỗi phase trả lời một câu hỏi trung tâm:

PhaseCâu hỏi trung tâmChapters
1 — Hiểu con daoLLM là gì, làm được gì, giới hạn ở đâu?Ch.1–2
2 — Kỹ thuật cốt lõiLàm sao output ổn định, kết nối thế giới thật, chạy pipeline?Ch.3–5
3 — Ship AgentAgent loop hoạt động thế nào?Ch.6

Cách sử dụng

Mỗi chapter có cấu trúc:

  • Concept — lý thuyết cốt lõi, giải thích bằng góc nhìn engineer
  • Code Lab — ví dụ chạy được, copy-paste vào terminal
  • Checkpoint — câu hỏi tự kiểm tra trước khi sang chapter tiếp
  • Đọc thêm — link tài liệu gốc cho ai muốn đào sâu
Nguyên tắc #1

Không cần hiểu hết mới được đi tiếp. Mỗi chapter được thiết kế để bạn nắm đủ 80% rồi move on. Phần 20% còn lại sẽ tự rõ khi bạn thực hành ở chapter sau.

Prerequisite

  • Biết code Python cơ bản (function, class, pip install)
  • Có terminal và editor (VS Code)
  • Có API key từ OpenAI hoặc Anthropic (hướng dẫn ở Chapter 1)

Bản đồ nhanh — Keyword nào thuộc nhóm nào

Trước khi bắt đầu, nắm sơ đồ này để không bị lạc:

NhómKeywordBạn cần khi nào
Dùng LLM (focus chính)prompt engineering, tool calling, MCP, agent, function calling, structured output, CoT, few-shotNgay bây giờ
Context & Memory (module sau)RAG, embedding, vector DB, chunking, rerankingSau khi ship agent đầu tiên
Huấn luyện modelfine-tuning, LoRA, RLHF, DPO, distillationKhi bài toán cụ thể yêu cầu
Hạ tầng MLMLOps, model serving, GPU infraKhác role hoàn toàn

90% công việc AI Engineer application nằm ở 2 nhóm đầu. Lộ trình này cover nhóm 1. Nhóm 2 (RAG, memory) sẽ là module tiếp theo.


Sẵn sàng? Bắt đầu từ Chapter 1 — LLM Foundations →