2024-07-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Parce que le projet nécessite des capacités de reconnaissance OCR et prend en charge un déploiement privatisé. Cet article comparera certains outils de reconnaissance OCR open source sur le marché, sélectionnera l'OCR qui répond aux besoins du projet et approfondira la recherche/la formation du modèle OCR correspondant.
Les principales reconnaissances OCR sont : Tesseract_OCR, PaddleOCR, EasyOCR, dddd_ocr, CnOCR
Remarques : Les images suivantes sont utilisées pour les tests comme suit
Pillow est une bibliothèque de traitement d'images gratuite et open source qui peut être utilisée pour lire, manipuler et enregistrer une variété de fichiers image. Tesseract-OCR est un puissant moteur de reconnaissance optique de caractères qui peut être reconnu hors ligne et identifier avec précision le texte dans les images. Il doit être utilisé conjointement avec le fichier tesseract-ocr.exe installé localement.
Caractéristiques de Tesseract-OCR :
Environnement d'installation: