Ekstrak adalah mesin pengenalan karakter optik untuk berbagai sistem operasi yang mengekstrak teks dari gambar dan mengubahnya menjadi teks biasa.
Model ini adalah bentuk yang sangat primitif dari Google Tesseract asli yang mengekstraksi teks (hanya huruf kapital) dari gambar dan mengubahnya menjadi teks biasa.
Note1:- Model terlatih tidak disediakan. Jadi untuk pertama kalinya menjalankan skrip apa adanya. Setelah model dilatih: komentar keluar 'train_model' on line '65' dan kemudian jalankan skrip untuk digunakan lebih lanjut.
Note2:- Hanya beberapa font yang diperhitungkan jadi ingatlah untuk menggunakan font default (Calibri) dalam teks gambar dengan ukuran font '72' karena ada asumsi untuk mengekstrak huruf.

Jalankan skrip di terminal Anda: 'python3 tesseract.py': gambar input adalah: 
Output adalah (hasil yang diprediksi ada di bagian bawah): 
Gambar input dapat dari sejumlah kata contoh: 
Output adalah: