[Caso] Ricerca sullo strumento di riconoscimento OCR integrato in Python

2024-07-12

Sommario

I. Introduzione
2. Tesseract_OCR
- 2.1. Processo di installazione
- 2.2. Uso del codice Python
3. OCR a palette
- 3.1. Processo di installazione
- 3.2. Uso del codice Python
4. OCR facile
5. ddddOCR
6.CnOCR
7. Riepilogo

I. Introduzione

Perché il progetto richiede funzionalità di riconoscimento OCR e supporta l'implementazione privatizzata. Questo articolo confronterà alcuni strumenti di riconoscimento OCR open source sul mercato, selezionerà l'OCR più adatto alle esigenze del progetto e svolgerà ulteriori ricerche/addestrerà il modello OCR corrispondente.
I principali riconoscimenti OCR sono: Tesseract_OCR, PaddleOCR, EasyOCR, dddd_ocr, CnOCR
Note: Le seguenti immagini vengono utilizzate per i test come segue
Per favore aggiungi la descrizione dell'immagine

2. Tesseract_OCR

Pillow è una libreria di elaborazione immagini gratuita e open source che può essere utilizzata per leggere, manipolare e salvare una varietà di file immagine. Tesseract-OCR è un potente motore di riconoscimento ottico dei caratteri che può essere riconosciuto offline e identificare accuratamente il testo nelle immagini. Deve essere utilizzato insieme al file tesseract-ocr.exe installato localmente.
Caratteristiche di Tesseract-OCR:

Tesseract supporta il formato di codifica UTF-8 e può riconoscere oltre 100 lingue "out of the box"
Tesseract supporta più formati di output: testo semplice, hOCR (HTML), PDF, ecc.
La raccomandazione ufficiale è che per ottenere risultati OCR migliori, è meglio fornire immagini di alta qualità
Tesseract allena a riconoscere altre lingue Per metodi di formazione specifici, fare riferimento alla documentazione ufficiale: https://tesseract-ocr.github.io/tessdoc/.

2.1. Processo di installazione

Ambiente di installazione：

Condivisione della tecnologia