Κοινή χρήση τεχνολογίας

[Υπόθεση] Έρευνα για το ενσωματωμένο εργαλείο αναγνώρισης OCR με python

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

εισαγωγή

Επειδή το έργο απαιτεί δυνατότητες αναγνώρισης OCR και υποστηρίζει την ιδιωτικοποιημένη ανάπτυξη. Αυτό το άρθρο θα συγκρίνει ορισμένα εργαλεία αναγνώρισης OCR ανοιχτού κώδικα στην αγορά, θα επιλέξει το OCR που ταιριάζει στις ανάγκες του έργου και θα ερευνήσει/εκπαιδεύσει περαιτέρω το αντίστοιχο μοντέλο OCR.
Οι κύριες αναγνωρίσεις OCR είναι: Tesseract_OCR, PaddleOCR, EasyOCR, dddd_ocr, CnOCR
Παρατηρήσεις: Οι παρακάτω εικόνες χρησιμοποιούνται για τη δοκιμή ως εξής
Προσθέστε περιγραφή εικόνας

2. Tesseract_OCR

Το Pillow είναι μια δωρεάν και ανοιχτού κώδικα βιβλιοθήκη επεξεργασίας εικόνας που μπορεί να χρησιμοποιηθεί για την ανάγνωση, το χειρισμό και την αποθήκευση μιας ποικιλίας αρχείων εικόνας. Το Tesseract-OCR είναι μια ισχυρή μηχανή οπτικής αναγνώρισης χαρακτήρων που μπορεί να αναγνωριστεί εκτός σύνδεσης και να προσδιορίσει με ακρίβεια το κείμενο στις εικόνες. Πρέπει να χρησιμοποιείται σε συνδυασμό με το τοπικά εγκατεστημένο αρχείο tesseract-ocr.exe.
Χαρακτηριστικά Tesseract-OCR:

  • Το Tesseract υποστηρίζει τη μορφή κωδικοποίησης UTF-8 και μπορεί να αναγνωρίσει περισσότερες από 100 γλώσσες "out of the box"
  • Το Tesseract υποστηρίζει πολλαπλές μορφές εξόδου: απλό κείμενο, hOCR (HTML), PDF κ.λπ.
  • Η επίσημη σύσταση είναι ότι για να έχετε καλύτερα αποτελέσματα OCR, είναι καλύτερο να παρέχετε εικόνες υψηλής ποιότητας
  • Το Tesseract εκπαιδεύει για την αναγνώριση άλλων γλωσσών Για συγκεκριμένες μεθόδους εκπαίδευσης, ανατρέξτε στην επίσημη τεκμηρίωση: https://tesseract-ocr.github.io/tessdoc/.

2.1 Διαδικασία εγκατάστασης

Περιβάλλον Εγκατάστασης