BÀI 6 — GEOMETRY (COSINE SIMILARITY)
🎯 Mục tiêu
Hiểu:
Độ dài vector (norm)
Góc giữa 2 vector
Cosine similarity (linh hồn của AI search)
🧠 1. ĐỘ DÀI VECTOR (NORM)
📌 Công thức

👉 độ dài:
√(9 + 16) = 5 🎯 Ý nghĩa
👉 độ “mạnh” / độ lớn của vector
🧠 2. GÓC GIỮA 2 VECTOR
📌 Công thức

🎯 Ý nghĩa
👉 đo độ giống nhau về hướng
🧠 3. COSINE SIMILARITY (CỰC QUAN TRỌNG) 📌 Giá trị = 1 → giống nhau hoàn toàn = 0 → không liên quan = -1 → ngược nhau 🔥 Ví dụ trực quan x = (1,0) y = (1,0) → cos = 1 (giống nhau)
y = (0,1) → cos = 0 (khác hoàn toàn) 🧠 4. TẠI SAO AI DÙNG COSINE?
👉 Vì:
❌ Không quan tâm độ lớn ✔️ Chỉ quan tâm hướng
🎯 Ví dụ AI thật 🔍 Search (Google / ChatGPT) Câu hỏi → vector Tài liệu → vector
👉 So sánh bằng cosine
🎬 Recommendation (Netflix) User vector Movie vector
👉 cosine → gợi ý phim
🤖 NLP (ChatGPT) từ → embedding vector câu → vector
👉 cosine → hiểu nghĩa
🔥 BÀI TẬP (QUAN TRỌNG) ✍️ Bài 1 (cơ bản)
Cho:
x = (3,4)
👉 Tính:
độ dài vector ✍️ Bài 2 (cosine)
Cho:
x = (1,2) y = (2,4)
👉 Tính:
cosine similarity ✍️ Bài 3 (tư duy AI)
👉 Trả lời:
Tại sao:
cosine tốt hơn Euclidean distance trong search? ✍️ Bài 4 (level cao)
Cho:
x = (1,1) y = (-1,-1)
👉 cosine = ?
👉 giải thích ý nghĩa
🧠 INSIGHT LEVEL CAO
👉 Embedding model (OpenAI, Google):
text → vector (512D, 768D, 1536D)
👉 tất cả đều:
dùng cosine similarity
All rights reserved