le mie informazioni di contatto
Posta[email protected]
2024-07-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Perché il progetto richiede funzionalità di riconoscimento OCR e supporta l'implementazione privatizzata. Questo articolo confronterà alcuni strumenti di riconoscimento OCR open source sul mercato, selezionerà l'OCR più adatto alle esigenze del progetto e svolgerà ulteriori ricerche/addestrerà il modello OCR corrispondente.
I principali riconoscimenti OCR sono: Tesseract_OCR, PaddleOCR, EasyOCR, dddd_ocr, CnOCR
Note: Le seguenti immagini vengono utilizzate per i test come segue
Pillow è una libreria di elaborazione immagini gratuita e open source che può essere utilizzata per leggere, manipolare e salvare una varietà di file immagine. Tesseract-OCR è un potente motore di riconoscimento ottico dei caratteri che può essere riconosciuto offline e identificare accuratamente il testo nelle immagini. Deve essere utilizzato insieme al file tesseract-ocr.exe installato localmente.
Caratteristiche di Tesseract-OCR:
Ambiente di installazione: