Asked Aug 22nd, 3:34 PM 79 0 2
  • 79 0 2
+1

[Hỏi] Áp dụng Yolov3 với bài toán nhận diện ký tự viết tay

Share
  • 79 0 2

Xin chào mọi người, Em đang ngâm cứu bài toán nhận diện chữ số viết tay. Em base trên 1 project ở github (https://github.com/penny4860/tf2-eager-yolo3 1) để train yolo3 với tập ký tự viết tay của e, tuy nhiên độ chính xác rất tệ (khoảng 10-20%), E cũng search trên google thì thấy rất ít người dùng yolov3 để nhận diện ký tự viết tay. E đang thấy mất định hướng, ko hiểu do dataset của e chưa đủ nhiều hay như nào. (tâp dataset của e có 10 ảnh, mỗi ảnh có 10 số). Thêm nữa, em train với dataset trên thì cũng rất chậm, mất khoảng 7s cho 1 epoch ,mà phải chạy khoảng 200 epoch thì train_loss nó mới nhỏ hơn 5, nhưng như e nói ở trên, kết quả khá tệ Em là newbie nên rất mong mọi người chỉ bảo định hướng như nào để giải quyết bài toán này a.

2 ANSWERS


Answered Aug 23rd, 4:09 AM
+2

Theo mình thì vấn đề nằm ở dữ liệu thật(mặc dù mình biết mục đích của bạn chỉ là cố fit sao cho model học được đúng trên 10 ảnh kia). Thay vì object detect ra 10 class, bạn thử train 1 class để model detect vùng số xong cho qua 1 pre-trained classify xem, mình nghĩ kết quả sẽ khả thi hơn đó. 😃)

Share
Answered Aug 25th, 12:19 AM
+1

Bạn nên cân nhắc lại việc set up dữ liệu, vì mình thấy nó rất ít (minimum phải là 1k) khi bạn sử dụng model deep learning để trích xuất đặc trưng thì sẽ không hiệu quả do ít dữ liệu để máy học, nhưng nếu bạn dùng những thuật toán thông thường (HOG, GIST, LBP,...) thì mình nghĩ nó hiệu quả. Hãy tham thảo thêm phần link Link: https://datascience.stackexchange.com/questions/45774/where-does-the-deep-learning-needs-big-data-rule-come-from

Share