Nếu mã như hình 11-20 thì có thể xây dựng thuật toán để nhận diện được bạn ạ. Còn những hình khác thì mình e là khá khó, mã captcha sinh ra để phân biệt người và máy mà, nên người ta thiết kế để máy không thể vượt qua được.
@thanhhau Captcha 11-20: e thử sử dụng thư viện tessract nhưng không nhận diện ra được
a có ý tưởng nào về mã captcha 11-20 ko? E định fill lại màu chữ thành đen, còn nền trắng. May ra Tesseact nhận dạng được
@mincasoft mỗi loại dữ liệu sẽ có một đặc điểm riêng, nên nếu có thể bạn nên xây dựng lại mô hình cho riêng mình như bài viết mà bạn @quocnb đã nhắc đến ở trên. Mình chưa sử dụng thư viện Tessract bao giờ nên cũng không rõ là cách bạn làm có được hay không.
Nếu mã như hình 11-20 thì có thể xây dựng thuật toán để nhận diện được bạn ạ. Còn những hình khác thì mình e là khá khó, mã captcha sinh ra để phân biệt người và máy mà, nên người ta thiết kế để máy không thể vượt qua được.
Cách làm bạn có thể xem qua bài viết này https://viblo.asia/p/breaking-a-captcha-by-machine-learning-bWrZneDbKxw
@quocnb cảm ơn anh. Bài này em đọc rồi. Có chút hạn chế là thế mạnh của e là .NET, nên Python em không rành? Chắc sẽ mất một tgian đầu tư.
@thanhhau Captcha 11-20: e thử sử dụng thư viện tessract nhưng không nhận diện ra được a có ý tưởng nào về mã captcha 11-20 ko? E định fill lại màu chữ thành đen, còn nền trắng. May ra Tesseact nhận dạng được
Có a/c nào ở đây đã làm việc với Google Cloud Vision chưa ạ? Cho em tham khảo với
@mincasoft bạn cần hỏi vấn đề gì về GG Cloud Vision thì cứ đặt câu hỏi mới lên. Sẽ có nhiều người biết để trả lời cho bạn hơn
@mincasoft mỗi loại dữ liệu sẽ có một đặc điểm riêng, nên nếu có thể bạn nên xây dựng lại mô hình cho riêng mình như bài viết mà bạn @quocnb đã nhắc đến ở trên. Mình chưa sử dụng thư viện Tessract bao giờ nên cũng không rõ là cách bạn làm có được hay không.
@thanhhau mình cũng nghĩ vậy, mỗi loại chắc phải xây dựng một model riêng để train data.