Teknologian jakaminen

[Case] ​​​​Tutkimus python-integroidusta OCR-tunnistustyökalusta

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

I. Johdanto

Koska projekti vaatii OCR-tunnistusominaisuuksia ja tukee yksityistettyä käyttöönottoa. Tässä artikkelissa verrataan joitain markkinoilla olevia avoimen lähdekoodin OCR-tunnistustyökaluja, valitaan projektin tarpeisiin sopiva OCR ja tutkitaan/koulutetaan vastaava OCR-malli.
Tärkeimmät OCR-tunnistukset ovat: Tesseract_OCR, PaddleOCR, EasyOCR, dddd_ocr, CnOCR
Huomautuksia: Seuraavia kuvia käytetään testaukseen seuraavasti
Lisää kuvan kuvaus

2. Tesseract_OCR

Pillow on ilmainen ja avoimen lähdekoodin kuvankäsittelykirjasto, jonka avulla voidaan lukea, käsitellä ja tallentaa erilaisia ​​kuvatiedostoja. Tesseract-OCR on tehokas optinen merkintunnistusmoottori, joka voidaan tunnistaa offline-tilassa ja tunnistaa tarkasti kuvien tekstin. Sitä on käytettävä yhdessä paikallisesti asennetun tesseract-ocr.exe-tiedoston kanssa.
Tesseact-OCR:n ominaisuudet:

  • Tesseract tukee UTF-8-koodausmuotoa ja pystyy tunnistamaan yli 100 kieltä.
  • Tesseract tukee useita tulostusmuotoja: pelkkä teksti, hOCR (HTML), PDF jne.
  • Virallinen suositus on, että parempien OCR-tulosten saamiseksi on parasta tarjota korkealaatuisia kuvia
  • Tesseract oppii tunnistamaan muita kieliä, katso viralliset asiakirjat: https://tesseract-ocr.github.io/tessdoc/.

2.1 Asennusprosessi

Asennusympäristö