2024-07-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Koska projekti vaatii OCR-tunnistusominaisuuksia ja tukee yksityistettyä käyttöönottoa. Tässä artikkelissa verrataan joitain markkinoilla olevia avoimen lähdekoodin OCR-tunnistustyökaluja, valitaan projektin tarpeisiin sopiva OCR ja tutkitaan/koulutetaan vastaava OCR-malli.
Tärkeimmät OCR-tunnistukset ovat: Tesseract_OCR, PaddleOCR, EasyOCR, dddd_ocr, CnOCR
Huomautuksia: Seuraavia kuvia käytetään testaukseen seuraavasti
Pillow on ilmainen ja avoimen lähdekoodin kuvankäsittelykirjasto, jonka avulla voidaan lukea, käsitellä ja tallentaa erilaisia kuvatiedostoja. Tesseract-OCR on tehokas optinen merkintunnistusmoottori, joka voidaan tunnistaa offline-tilassa ja tunnistaa tarkasti kuvien tekstin. Sitä on käytettävä yhdessä paikallisesti asennetun tesseract-ocr.exe-tiedoston kanssa.
Tesseact-OCR:n ominaisuudet:
Asennusympäristö: