Thư viện nào nhận diện chữ (font máy tính) tốt nhất mọi người nhỉ?
Chào mọi người. Lại là mình, thánh câu hỏi đây. Dựa vào kinh nghiệm làm việc thì các bạn thấy thư viện nào nhận diện text tốt nhất or có solution nhận diện chữ viết tốt không à. Bài toán của mình đơn giản là text trên các bản vẽ kỹ thuật thông thường. (Font: Calibri chẳng hạn) hiện tại mình sử dụng tesseract nhưng cảm giác kết quả không quá tốt. Dù chữ rất dễ nhận chứ không bị nhiễu. Chữ bị nghiêng thì phải xoay ảnh đi. (phải pre-processing hơi nhiều) kết quả lại ko tốt.
Nhờ anh em giúp cách improve hay 1 solution tốt hơn. Cảm ơn mọi người
2 CÂU TRẢ LỜI
Chào bạn, đây là bài toán OCR, có 2 hướng tiếp cận như sau
- Sử dụng thư viện: Google Vision,...
- Tự xây dựng mô hình CRNN, SRN, SEE,...
Bạn có thể tìm hiểu thêm về bài toán OCR.
Cảm ơn bạn nhé!
Ngoài Tesseract thì còn khá nhiều, bạn có thể xem qua ở đây https://github.com/kba/awesome-ocr
Còn kinh nghiệm cái nào tốt thì mình không biết
Tốt thì chỉ có xây dựng lại mạng, train lại với dữ liệu của mình. Mình nghĩ vậy
Để mình ngâm cứu thêm sao