Framework · Growth & UA Team

AI Optimization Layers

3 tầng để tối ưu output của AI — từ viết lệnh tốt hơn đến xây dựng agent tự thực thi tác vụ phức tạp.

Tier 1 · Prompt Engineering
Tầng input — cách viết lệnh cho AI
Tối ưu cách viết instruction — vai trò, ví dụ mẫu, ràng buộc, format, chuỗi suy luận. Tác động ở từng request riêng lẻ.
Thiết kế input
Zero / Few-shotCung cấp ví dụ mẫu
Role · PersonaGán danh tính chuyên gia
Negative promptingChỉ rõ KHÔNG làm gì
CounterexampleVí dụ sai + lý do sai
Template patternFormat output cố định
Reasoning
Chain of ThoughtSuy luận từng bước
Tree / Graph of ThoughtNhiều nhánh, backtrack
DecompositionChia nhỏ thành chuỗi prompt
Độ tin cậy
Self-consistencyChạy nhiều lần · majority vote
Self-critiqueModel tự review output của mình
Tier 2 · Context Engineering
Tầng context window — bao gồm toàn bộ Tier 1
Tối ưu toàn bộ context window — không chỉ viết prompt tốt mà còn kiểm soát thông tin gì được đưa vào, khi nào, và bao nhiêu token. Bao gồm toàn bộ Tier 1.
Cơ bản
RAGRetrieve → đưa vào context
Just-in-time contextLoad đúng lúc cần dùng
Dual MemoryShort-term + Long-term
Structured NotesGhi chú ngoài có cấu trúc
Trung bình → Nâng cao
Chunking strategyKích thước + overlap tối ưu
Retrieval precisionĐúng chunk · ít noise
Adaptive CompactionTự động nén khi gần hết token
Tier 3 · Harness Engineering
Tầng agent — bao gồm toàn bộ 2 tầng bên dưới
AI không chỉ trả lời — mà tự thực thi tác vụ: tạo file, research, gọi API, ra quyết định đa bước. Tầng này bao gồm toàn bộ Prompt + Context Engineering, cộng thêm Tool Use và kiến trúc Agent.
Harness = Prompt + Context + Tools
Prompt Eng.
+
Context Eng.
+
Tool Use
=
Agent
Tầng công cụ
Tool useAPI · file · search
MCP serverKết nối dịch vụ ngoài
n8n agentTự động hóa workflow
Code executionChạy code trực tiếp
Agent patterns
ReAct loopReason → Act → Observe
Multi-agentSupervisor + Worker
Self-planningAI tự lên kế hoạch
Memory writeLưu state giữa các bước
Evaluation — bước tiếp theo để hiệu chỉnh hệ thống
Cross-cutting concern · áp dụng cho cả 3 tầng
Reasoning layer
Agent hiểu đúng yêu cầu chưa? Kế hoạch có logic không? Intent router parse đúng không?
Action layer
Chọn đúng tool chưa? Truyền data có chuẩn không? Thứ tự thực thi có đúng không?
Retrieval quality
Các chunk được pull có liên quan không? Bao nhiêu noise? Trade-off giữa precision và recall.
Output quality
Format đúng chưa? Có consistent không? Có hallucinate không? Chi phí token hợp lý chưa?
Bắt đầu đơn giản nhất: log input/output từng node n8n ra Google Sheets → review mỗi tuần → tìm fail pattern. Không cần RAGAS hay TruLens ở giai đoạn này.
Nguyên tắc cốt lõi
Context đủ > Prompt tốt
Impact tăng dần
Prompt → Context → Harness
Evaluation
Đo được mới scale được
Prompt Engineering là Tier 1 — nền tảng của mọi thứ. Dù context có hoàn hảo, prompt yếu vẫn ra output yếu. Các kỹ thuật dưới đây đi từ cơ bản → nâng cao, kèm ví dụ thực tế từ ngữ cảnh UA / Marketing.
01
Zero-shot vs Few-shot
Cho ví dụ mẫu để model học ngay format và tone muốn dùng
Cơ bản
Prompt yếu
Viết quảng cáo Facebook cho game mobile của tao.
Output nhận được
🎮 Chơi game mobile tuyệt vời ngay! Tải miễn phí và tận hưởng giờ phút vui vẻ. Game hay nhất 2024!
Prompt tốt (few-shot)
Viết quảng cáo Facebook cho game mobile nhắm vào casual gamer 25–35 tuổi tại Việt Nam. Dùng format sau:

Hook: [gây tò mò hoặc nêu vấn đề]
Body: [lợi ích trong 1 câu]
CTA: [hành động cụ thể]

Tone tham khảo: "Bạn có 5 phút? Đủ để vượt 10 màn rồi đó."
Output nhận được
Hook: Tan làm, bạn thường làm gì 10 phút đầu trên xe buýt?
Body: Game nhập vai nhẹ nhàng, không cần mạng — chơi bất cứ đâu.
CTA: Tải miễn phí, không quảng cáo trong 7 ngày đầu.
02
Role / Persona pattern
Gán danh tính chuyên gia với phong cách ra quyết định cụ thể
Cơ bản
Prompt yếu
Phân tích hiệu quả campaign UA của tao.
Output nhận được
Campaign của bạn có một số chỉ số. CTR và CPI là các KPI quan trọng cần theo dõi. Bạn nên tối ưu hóa creative và targeting...
Prompt tốt
Mày là UA manager cấp senior cho game mobile tại SEA, 5 năm kinh nghiệm tối ưu Facebook và TikTok. Mày tư duy theo ROAS, D7 retention, và payback period. Nói thẳng và đánh dấu rủi ro rõ ràng.

Phân tích data campaign này: [data]
Output nhận được
⚠️ CPI $1.8 với D7 retention 18% → payback period ~45 ngày, quá dài cho thể loại này. Tao sẽ pause TH-Android và chuyển ngân sách sang VN-iOS nơi CPI $0.9 và D7 đạt 26%.
03
Chain of Thought (CoT)
Bắt model suy luận từng bước trước khi đưa ra kết luận
Trung bình
Prompt yếu
Nên scale ngân sách UA sang thị trường nào quý tới?
Output nhận được
Nên scale sang Indonesia vì có lượng người dùng lớn và thị trường game mobile đang tăng trưởng.
Prompt tốt (CoT)
Nên scale ngân sách UA sang thị trường nào quý tới? Suy luận theo từng bước:
1. Đánh giá từng market theo CPI trend, D7 retention, ARPU
2. Xác định market có payback period tốt nhất
3. Gắn flag rủi ro cho từng market
4. Đưa ra khuyến nghị cuối kèm lý do
Output nhận được
1. VN: CPI $0.9↓, D7 28%, ARPU $0.4 | TH: CPI $1.4↑, D7 22%, ARPU $0.6 | ID: CPI $0.7, D7 19%, ARPU $0.3
2. Payback: VN ~18 ngày · TH ~33 ngày · ID ~28 ngày
3. Rủi ro: TH CPI đang tăng · ID ARPU thấp
4. → Scale VN trước. Test ID với 20% ngân sách tăng thêm.
04
Negative prompting + Template pattern
Chỉ rõ không làm gì + enforce cấu trúc output để dùng downstream
Trung bình
Prompt yếu
Tóm tắt hiệu quả campaign tuần này cho buổi họp team.
Output nhận được
Tuần này các campaign hoạt động không đều ở các thị trường. Một số chỉ số cải thiện trong khi các chỉ số khác giảm. Nhìn chung team đã làm tốt trong việc quản lý phân bổ ngân sách...
Prompt tốt
Tóm tắt hiệu quả campaign cho weekly review. Dùng đúng format này:

**Market tốt nhất:** [market] — [1 lý do cụ thể kèm con số]
**Cần chú ý:** [market] — [chỉ số cụ thể + con số + so sánh tuần trước]
**Action cần làm:** [1 hành động cụ thể]

KHÔNG viết dài dòng. KHÔNG dùng từ mơ hồ như "tốt" hay "cải thiện". Lấy số liệu từ GDS để so sánh cụ thể.
Output nhận được
Market tốt nhất: VN — CPI giảm còn $0.85, D7 đạt 29%
Cần chú ý: TH — CPI tăng 18% WoW, hiện $1.65
Action cần làm: Pause TH broad audience, giữ lại lookalike L1–L3
05
Self-critique pattern
Yêu cầu model tự review và cải thiện output trước khi trả về
Nâng cao
Không có self-critique
Viết 3 ad hook cho idle RPG nhắm thị trường Philippines.
Output nhận được
1. "Chơi RPG hay nhất ngay!"
2. "Trở thành anh hùng mạnh nhất!"
3. "Tải miễn phí hôm nay!"
Có self-critique
Viết 3 ad hook cho idle RPG nhắm Philippines, 18–28 tuổi. Sau khi viết xong, tự đánh giá từng hook: đủ cụ thể chưa? Có tạo sự tò mò hoặc cảm giác bỏ lỡ không? Rồi viết lại hook yếu nhất.
Output nhận được
Bản nháp: "Mag-level up kahit natutulog ka" / "1 tap lang, 1000 enemies down" / "Your guild is waiting"

Đánh giá: Hook 3 quá chung chung. Viết lại: "Your guild just cleared Stage 80. You haven't logged in yet."
Just-in-time Context

Thay vì dump toàn bộ thông tin vào prompt ngay từ đầu, chỉ load đúng context cần thiết tại thời điểm cần dùng. Đây là kỹ thuật cốt lõi trong Context Engineering — kiểm soát cái gì vào context, khi nào, và bao nhiêu token.

← Xem vị trí kỹ thuật này trong Tổng quan
Ví dụ: Obsidian + MCP local
Obsidian Vault
Kiến thức trong file .md
MCP Server (local)
Bridge: Vault ↔ Claude
Query kích hoạt
Just-in-time load
Claude Desktop
Nhận đúng context cần
Output chính xác
Không hallucinate
Tại sao cách này hiệu quả — 3 lý do
Đúng context, đúng lúc
Claude chỉ nhận file/note liên quan đến câu hỏi hiện tại. Không có noise từ kiến thức không liên quan. Giảm hallucination, tăng độ chính xác.
Tiết kiệm token
Load 1 file .md liên quan tốn ~500–2000 token so với dump cả vault có thể lên 100K+ token. Nhanh hơn và rẻ hơn mỗi query.
Kiến thức tích lũy theo thời gian
Mỗi note thêm vào Obsidian mở rộng "bộ nhớ" của Claude về chủ đề đó. Hệ thống thông minh hơn khi vault lớn dần mà không cần retrain.
Tối ưu token — 3 kỹ thuật
01
Chọn đúng model cho từng loại tác vụ
Đừng dùng Opus để làm việc mà Haiku đủ sức làm
Các tác vụ khác nhau cần sức mạnh xử lý khác nhau — và chi phí cũng khác nhau. Khớp năng lực model với độ phức tạp của tác vụ thay vì mặc định dùng model mạnh nhất mọi lúc.
Flow khuyến nghị
Opus · Lập kế hoạch
→ chiến lược, kiến trúc, phân tích phức tạp
Sonnet · Thực thi
→ viết nội dung, tóm tắt, tác vụ có cấu trúc
Haiku · Routine
→ phân loại, gắn tag, tra cứu nhanh
02
Tóm tắt và chuyển sang cửa sổ mới
Khi chat quá dài, reset với một bản tóm tắt gọn
Khi cuộc trò chuyện dài ra, mỗi tin nhắn mới phải mang theo toàn bộ lịch sử — chi phí token tích lũy theo cấp số nhân. Khi session quá dài, hãy yêu cầu AI tóm tắt các quyết định và context quan trọng, rồi tiếp tục trong cửa sổ mới với bản tóm tắt đó làm điểm xuất phát.
Prompt để dùng
"Hãy tóm tắt cuộc thảo luận của chúng ta thành: (1) các quyết định đã đưa ra, (2) context quan trọng cần mang sang cửa sổ chat mới, (3) các câu hỏi còn mở. Giữ dưới 300 từ."
03
Knowledge base để inject context
Dùng file .md hoặc Obsidian vault để load context có cấu trúc
Thay vì giải thích lại context mỗi session, duy trì một knowledge base có cấu trúc được inject theo nhu cầu. Hai cách tiếp cận thực tế:
Cách A — File .md đơn giản
Tạo file context.md chứa: cấu trúc team, setup campaign, định nghĩa market, KPI benchmark. Paste vào Claude khi bắt đầu session. Phù hợp cho cá nhân.
Cách B — Obsidian + MCP Nâng cao
Mỗi người có vault riêng. MCP chỉ pull đúng note liên quan khi query. Scale được cho cả team. Just-in-time loading = ít tốn token, context luôn cập nhật.