τα στοιχεία επικοινωνίας μου
Ταχυδρομείο[email protected]
2024-07-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Επειδή το έργο απαιτεί δυνατότητες αναγνώρισης OCR και υποστηρίζει την ιδιωτικοποιημένη ανάπτυξη. Αυτό το άρθρο θα συγκρίνει ορισμένα εργαλεία αναγνώρισης OCR ανοιχτού κώδικα στην αγορά, θα επιλέξει το OCR που ταιριάζει στις ανάγκες του έργου και θα ερευνήσει/εκπαιδεύσει περαιτέρω το αντίστοιχο μοντέλο OCR.
Οι κύριες αναγνωρίσεις OCR είναι: Tesseract_OCR, PaddleOCR, EasyOCR, dddd_ocr, CnOCR
Παρατηρήσεις: Οι παρακάτω εικόνες χρησιμοποιούνται για τη δοκιμή ως εξής
Το Pillow είναι μια δωρεάν και ανοιχτού κώδικα βιβλιοθήκη επεξεργασίας εικόνας που μπορεί να χρησιμοποιηθεί για την ανάγνωση, το χειρισμό και την αποθήκευση μιας ποικιλίας αρχείων εικόνας. Το Tesseract-OCR είναι μια ισχυρή μηχανή οπτικής αναγνώρισης χαρακτήρων που μπορεί να αναγνωριστεί εκτός σύνδεσης και να προσδιορίσει με ακρίβεια το κείμενο στις εικόνες. Πρέπει να χρησιμοποιείται σε συνδυασμό με το τοπικά εγκατεστημένο αρχείο tesseract-ocr.exe.
Χαρακτηριστικά Tesseract-OCR:
Περιβάλλον Εγκατάστασης: