Partage de technologie

[Cas] Recherche sur l'outil de reconnaissance OCR intégré à Python

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Introduction

Parce que le projet nécessite des capacités de reconnaissance OCR et prend en charge un déploiement privatisé. Cet article comparera certains outils de reconnaissance OCR open source sur le marché, sélectionnera l'OCR qui répond aux besoins du projet et approfondira la recherche/la formation du modèle OCR correspondant.
Les principales reconnaissances OCR sont : Tesseract_OCR, PaddleOCR, EasyOCR, dddd_ocr, CnOCR
Remarques : Les images suivantes sont utilisées pour les tests comme suit
Veuillez ajouter une description de l'image

2. Tesseract_OCR

Pillow est une bibliothèque de traitement d'images gratuite et open source qui peut être utilisée pour lire, manipuler et enregistrer une variété de fichiers image. Tesseract-OCR est un puissant moteur de reconnaissance optique de caractères qui peut être reconnu hors ligne et identifier avec précision le texte dans les images. Il doit être utilisé conjointement avec le fichier tesseract-ocr.exe installé localement.
Caractéristiques de Tesseract-OCR :

  • Tesseract prend en charge le format d'encodage UTF-8 et peut reconnaître plus de 100 langues « prêtes à l'emploi »
  • Tesseract prend en charge plusieurs formats de sortie : texte brut, hOCR (HTML), PDF, etc.
  • La recommandation officielle est que pour obtenir de meilleurs résultats OCR, il est préférable de fournir des images de haute qualité.
  • Tesseract s'entraîne à reconnaître d'autres langues Pour les méthodes de formation spécifiques, veuillez vous référer à la documentation officielle : https://tesseract-ocr.github.io/tessdoc/.

2.1. Processus d'installation

Environnement d'installation