Asked Dec 28th, 2018 3:31 PM 78 0 2
  • 78 0 2
0

Thư viện nào nhận diện chữ (font máy tính) tốt nhất mọi người nhỉ?

Share
  • 78 0 2

Chào mọi người. Lại là mình, thánh câu hỏi đây. Dựa vào kinh nghiệm làm việc thì các bạn thấy thư viện nào nhận diện text tốt nhất or có solution nhận diện chữ viết tốt không à. Bài toán của mình đơn giản là text trên các bản vẽ kỹ thuật thông thường. (Font: Calibri chẳng hạn) hiện tại mình sử dụng tesseract nhưng cảm giác kết quả không quá tốt. Dù chữ rất dễ nhận chứ không bị nhiễu. Chữ bị nghiêng thì phải xoay ảnh đi. (phải pre-processing hơi nhiều) kết quả lại ko tốt. 😐

Nhờ anh em giúp cách improve hay 1 solution tốt hơn. Cảm ơn mọi người

2 ANSWERS


Answered Dec 28th, 2018 5:06 PM
+3

Chào bạn, đây là bài toán OCR, có 2 hướng tiếp cận như sau

  1. Sử dụng thư viện: Google Vision,...
  2. Tự xây dựng mô hình CRNN, SRN, SEE,...

Bạn có thể tìm hiểu thêm về bài toán OCR.

Share
Anh Tuấn Hoàng @kstn_hut_hat
Jan 2nd, 3:33 AM

Cảm ơn bạn nhé!

0
| Reply
Share
Answered Dec 29th, 2018 11:29 AM
+3

Ngoài Tesseract thì còn khá nhiều, bạn có thể xem qua ở đây https://github.com/kba/awesome-ocr

Còn kinh nghiệm cái nào tốt thì mình không biết 😃

Tốt thì chỉ có xây dựng lại mạng, train lại với dữ liệu của mình. Mình nghĩ vậy 😃

Share
Anh Tuấn Hoàng @kstn_hut_hat
Jan 2nd, 3:33 AM

Để mình ngâm cứu thêm sao 😄

0
| Reply
Share