2024-07-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Denn das Projekt erfordert OCR-Erkennungsfähigkeiten und unterstützt den privatisierten Einsatz. In diesem Artikel werden einige Open-Source-OCR-Erkennungstools auf dem Markt verglichen, die OCR ausgewählt, die den Anforderungen des Projekts entspricht, und das entsprechende OCR-Modell weiter erforscht/trainiert.
Die wichtigsten OCR-Erkennungen sind: Tesseract_OCR, PaddleOCR, EasyOCR, dddd_ocr, CnOCR
Anmerkungen: Die folgenden Bilder werden wie folgt zum Testen verwendet
Pillow ist eine kostenlose Open-Source-Bildverarbeitungsbibliothek, mit der eine Vielzahl von Bilddateien gelesen, bearbeitet und gespeichert werden können. Tesseract-OCR ist eine leistungsstarke optische Zeichenerkennungs-Engine, die offline erkannt und Text in Bildern genau identifizieren kann. Sie muss in Verbindung mit der lokal installierten Datei tesseract-ocr.exe verwendet werden.
Tesseract-OCR-Funktionen:
Installationsumgebung: