Berbagi teknologi

[Kasus] ​​Penelitian tentang alat pengenalan OCR terintegrasi python

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

I. Pendahuluan

Karena proyek tersebut memerlukan kemampuan pengenalan OCR dan mendukung penerapan yang diprivatisasi. Artikel ini akan membandingkan beberapa alat pengenalan OCR open source di pasar, memilih OCR yang sesuai dengan kebutuhan proyek, dan meneliti/melatih lebih lanjut model OCR yang sesuai.
Pengakuan OCR utama adalah: Tesseract_OCR, PaddleOCR, EasyOCR, dddd_ocr, CnOCR
Keterangan: Gambar berikut digunakan untuk pengujian sebagai berikut
Silakan tambahkan deskripsi gambar

2. Tesseract_OCR

Pillow adalah perpustakaan pemrosesan gambar sumber terbuka dan gratis yang dapat digunakan untuk membaca, memanipulasi, dan menyimpan berbagai file gambar. Tesseract-OCR adalah mesin pengenalan karakter optik yang kuat yang dapat dikenali secara offline dan secara akurat mengidentifikasi teks dalam gambar. Ini harus digunakan bersama dengan file tesseract-ocr.exe yang diinstal secara lokal.
Fitur Tesseract-OCR:

  • Tesseract mendukung format pengkodean UTF-8 dan dapat mengenali lebih dari 100 bahasa "out of the box"
  • Tesseract mendukung berbagai format keluaran: teks biasa, hOCR (HTML), PDF, dll.
  • Rekomendasi resminya adalah untuk mendapatkan hasil OCR yang lebih baik, yang terbaik adalah memberikan gambar berkualitas tinggi
  • Tesseract berlatih untuk mengenali bahasa lain. Untuk metode pelatihan khusus, silakan merujuk ke dokumentasi resmi: https://tesseract-ocr.github.io/tessdoc/

2.1.Proses instalasi

Lingkungan Instalasi