[Case] Tutkimus python-integroidusta OCR-tunnistustyökalusta

2024-07-12

Sisällysluettelo

I. Johdanto
2. Tesseract_OCR
- 2.1 Asennusprosessi
- 2.2 Python-koodin käyttö
3. PaddleOCR
- 3.1 Asennusprosessi
- 3.2 Python-koodin käyttö
4. EasyOCR
5. ddddOCR
6. CnOCR
7. Yhteenveto

I. Johdanto

Koska projekti vaatii OCR-tunnistusominaisuuksia ja tukee yksityistettyä käyttöönottoa. Tässä artikkelissa verrataan joitain markkinoilla olevia avoimen lähdekoodin OCR-tunnistustyökaluja, valitaan projektin tarpeisiin sopiva OCR ja tutkitaan/koulutetaan vastaava OCR-malli.
Tärkeimmät OCR-tunnistukset ovat: Tesseract_OCR, PaddleOCR, EasyOCR, dddd_ocr, CnOCR
Huomautuksia: Seuraavia kuvia käytetään testaukseen seuraavasti
Lisää kuvan kuvaus

2. Tesseract_OCR

Pillow on ilmainen ja avoimen lähdekoodin kuvankäsittelykirjasto, jonka avulla voidaan lukea, käsitellä ja tallentaa erilaisia kuvatiedostoja. Tesseract-OCR on tehokas optinen merkintunnistusmoottori, joka voidaan tunnistaa offline-tilassa ja tunnistaa tarkasti kuvien tekstin. Sitä on käytettävä yhdessä paikallisesti asennetun tesseract-ocr.exe-tiedoston kanssa.
Tesseact-OCR:n ominaisuudet:

Tesseract tukee UTF-8-koodausmuotoa ja pystyy tunnistamaan yli 100 kieltä.
Tesseract tukee useita tulostusmuotoja: pelkkä teksti, hOCR (HTML), PDF jne.
Virallinen suositus on, että parempien OCR-tulosten saamiseksi on parasta tarjota korkealaatuisia kuvia
Tesseract oppii tunnistamaan muita kieliä, katso viralliset asiakirjat: https://tesseract-ocr.github.io/tessdoc/.

2.1 Asennusprosessi

Asennusympäristö：

Teknologian jakaminen