Condivisione della tecnologia

[Caso] Ricerca sullo strumento di riconoscimento OCR integrato in Python

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

I. Introduzione

Perché il progetto richiede funzionalità di riconoscimento OCR e supporta l'implementazione privatizzata. Questo articolo confronterà alcuni strumenti di riconoscimento OCR open source sul mercato, selezionerà l'OCR più adatto alle esigenze del progetto e svolgerà ulteriori ricerche/addestrerà il modello OCR corrispondente.
I principali riconoscimenti OCR sono: Tesseract_OCR, PaddleOCR, EasyOCR, dddd_ocr, CnOCR
Note: Le seguenti immagini vengono utilizzate per i test come segue
Per favore aggiungi la descrizione dell'immagine

2. Tesseract_OCR

Pillow è una libreria di elaborazione immagini gratuita e open source che può essere utilizzata per leggere, manipolare e salvare una varietà di file immagine. Tesseract-OCR è un potente motore di riconoscimento ottico dei caratteri che può essere riconosciuto offline e identificare accuratamente il testo nelle immagini. Deve essere utilizzato insieme al file tesseract-ocr.exe installato localmente.
Caratteristiche di Tesseract-OCR:

  • Tesseract supporta il formato di codifica UTF-8 e può riconoscere oltre 100 lingue "out of the box"
  • Tesseract supporta più formati di output: testo semplice, hOCR (HTML), PDF, ecc.
  • La raccomandazione ufficiale è che per ottenere risultati OCR migliori, è meglio fornire immagini di alta qualità
  • Tesseract allena a riconoscere altre lingue Per metodi di formazione specifici, fare riferimento alla documentazione ufficiale: https://tesseract-ocr.github.io/tessdoc/.

2.1. Processo di installazione

Ambiente di installazione