0

BÀI 6 — GEOMETRY (COSINE SIMILARITY)

🎯 Mục tiêu

Hiểu:

Độ dài vector (norm) Góc giữa 2 vector Cosine similarity (linh hồn của AI search) 🧠 1. ĐỘ DÀI VECTOR (NORM) 📌 Công thức Ảnh chụp Màn hình 2026-04-28 lúc 15.01.37.png

👉 độ dài:

√(9 + 16) = 5 🎯 Ý nghĩa

👉 độ “mạnh” / độ lớn của vector

🧠 2. GÓC GIỮA 2 VECTOR 📌 Công thức ​Ảnh chụp Màn hình 2026-04-28 lúc 15.01.57.png

🎯 Ý nghĩa

👉 đo độ giống nhau về hướng

🧠 3. COSINE SIMILARITY (CỰC QUAN TRỌNG) 📌 Giá trị = 1 → giống nhau hoàn toàn = 0 → không liên quan = -1 → ngược nhau 🔥 Ví dụ trực quan x = (1,0) y = (1,0) → cos = 1 (giống nhau)

y = (0,1) → cos = 0 (khác hoàn toàn) 🧠 4. TẠI SAO AI DÙNG COSINE?

👉 Vì:

❌ Không quan tâm độ lớn ✔️ Chỉ quan tâm hướng

🎯 Ví dụ AI thật 🔍 Search (Google / ChatGPT) Câu hỏi → vector Tài liệu → vector

👉 So sánh bằng cosine

🎬 Recommendation (Netflix) User vector Movie vector

👉 cosine → gợi ý phim

🤖 NLP (ChatGPT) từ → embedding vector câu → vector

👉 cosine → hiểu nghĩa

🔥 BÀI TẬP (QUAN TRỌNG) ✍️ Bài 1 (cơ bản)

Cho:

x = (3,4)

👉 Tính:

độ dài vector ✍️ Bài 2 (cosine)

Cho:

x = (1,2) y = (2,4)

👉 Tính:

cosine similarity ✍️ Bài 3 (tư duy AI)

👉 Trả lời:

Tại sao:

cosine tốt hơn Euclidean distance trong search? ✍️ Bài 4 (level cao)

Cho:

x = (1,1) y = (-1,-1)

👉 cosine = ?

👉 giải thích ý nghĩa

🧠 INSIGHT LEVEL CAO

👉 Embedding model (OpenAI, Google):

text → vector (512D, 768D, 1536D)

👉 tất cả đều:

dùng cosine similarity


All rights reserved

Viblo
Hãy đăng ký một tài khoản Viblo để nhận được nhiều bài viết thú vị hơn.
Đăng kí