Yêu cầu thg 7 30, 2019 4:17 SA 654 0 1
  • 654 0 1
+1

Nhờ giúp đỡ về vấn đề Cắt ảnh captcha và fill màu bằng OpenCV, Python, Pillow

Chia sẻ
  • 654 0 1

Em cũng mới tìm hiểu về OpenCV và Computer Vision nên còn non kinh nghiệm ạ.

Em muốn nhờ các anh cao thủ góp ý về vde này. Em có captcha có border line dạng như trong hình, em đã tiền xử lý để ra được kết quả, nhưng e gặp 2 vde như sau :

  • Làm thế nào để crop các chữ bị dính vào nhau
  • Làm thế nào để fill màu vào các chữ mà chỉ có border như trong hình, để kết quả xử lý tốt hơn Rất mong muốn nhận được góp ý của các anh để giải quyết bế tắc 😦

Xin cảm ơn ạ!

1 CÂU TRẢ LỜI


Đã trả lời thg 8 1, 2019 4:05 SA
+2

Theo mình nghĩ thì cả hai bài toán của bạn đều không thể giải quyết theo các phương pháp xử lí ảnh đơn thuần được.

Lí do:

  • Các chữ cái trong Capcha vốn dĩ bị thêm nhiễu, bị viết đè lên nhau, kích thước khác nhau, vị trí lộn xộn => không có rule chung => Không có cách nào để tách ra theo các phương pháp thông thường (Rule base).
  • Capcha thường thêm vài nét giống nét chữ để tạo nhiễu, khi xử lí ảnh loại nét nhiễu, thuật toán thường loại nhầm cả nét chữ (vì đối với thuật toán thì tính chất của nét nhiễu và nét chữ là tương tự nhau).

Giải pháp: Mình nghĩ bạn nên áp dụng các thuật toán Deep learning vào thì hơn

Chia sẻ
Avatar ha tung @hadongtung
thg 8 1, 2019 9:17 SA

Thank a đã phản hồi. Em cũng nghĩ như thế, nhưng e nghĩ việc cắt chữ ra để cho máy học từng chữ cái sẽ đơn giản và cho độ chính xác cao hơn việc để máy học cả 4 chữ như thế a. E đã thử cho chạy theo ông này, https://github.com/nickliqian/cnn_captcha với 4 chữ cái thì kết quả, cho độ chính xác thấp quá . Em đọc thì có theo hướng dẫn https://github.com/ypwhs/captcha_break thì thấy có nói độ chính xác lên tới 99%. Theo a thì ntn ạ?

Avatar Trung Thành Nguyễn @TrungThanhNguyen0502
thg 8 15, 2019 1:28 SA

@hadongtung sr vì giờ mới check viblo, trong link github bạn gửi, người ta dùng 1 mạng CNN (Deep learning) với thuật toán CTC nhé, bạn có thể tìm hiểu về "CTC Deep learning", kĩ thuật này không cắt, tách chữ như bạn tưởng mà predict cả cục luôn :3

Viblo
Hãy đăng ký một tài khoản Viblo để nhận được nhiều bài viết thú vị hơn.
Đăng kí