Cách tạo ra bounding box trong YOLO?

Question

Chào mọi người. Mình đang đọc về Yolo. Mỗi ảnh chia thành các grid. Mỗi grid sẽ dự đoán 1 số lượng cố định bounding box (do mình truyền vào). Các tạo ra bounding box là dùng k-clustering. Nhưng mìn...

Answer

Chào bạn. Câu hỏi của bạn có lẽ đang nói đến YOLOv2. Như phần trên bạn đã đưa ra câu hỏi. YOLO sẽ chia ảnh của chúng ta thành các ô cố định (giả sử grid có kích thước10x10) và trong mỗi ô nhỏ đó sẽ chịu trách nhiệm dự đoán một object nếu như tâm (centroid) của object được phát hiện nằm trong ô nhỏ này (tức là conffidence score lớn hơn một ngưỡng nào đó giả sử là 0.25).

- Dựa vào đâu để hình thành bounding box?

Để dự đoán người ta sử dụng CNN layers để dự đoán các tham số của box chứa object dựa vào các box mẫu (anchor boxes) tức là các box có kích thước được định nghĩa trước. Giống như trong Faster RCNN sau đó dựa vào các box mẫu này để tinh chỉnh tọa độ cho phù hợp với objects.

- Dùng k-clustering ra sao?

Để training ra các anchors này chúng ta cần sử dụng K-Clustering và cần phải có một độ đo để dùng làm hàm loss. Như trong YOLOv2 sử dụng IOU (Intersection Over Union, thể hiện độ khớp của prediction box so với ground-truth box). Thay đổi số lượng centroids cho phù hợp với nhu cầu của bạn (về cơ bản càng nhiều cụm thì chỉ số IoU càng tăng - càng khớp với ground-truth)

1 CÂU TRẢ LỜI