01 April 2009

Mengenal OCR

Anda mendapat tugas merangkum atau menyalin sebuah bab dari buku teks? Tidak perlu kalut dengan tugas tersebut. Dengan memanfaatkan OCR, Anda dapat men-scan buku teks dan langsung mengeditnya di aplikasi word processor. Secara sederhana,Optical Character Recognition (OCR) adalah proses menerjemahkan materi cetakan (buku, koran, majalah) ke dalam file teks yang dapat diedit dan disimpan. Teknologi ini memungkinkan menyimpan materi-materi cetakan ke dalam format teks yang lebih menghemat ruang di harddisk, ketimbang menyimpannya dalam bentuk gambar.

Sebelum ditemukannya teknologi ini, seseorang harus mengetik ulang materi cetakan huruf demi huruf yang jelas memakan waktu dan tenaga yang lebih besar. OCR merupakan hasil gabungan riset dalam bidang pengenalan pola (pattern recognition), kecerdasan buatan (artifi cial intelligence), dan penginderaan mesin (machine vision). Pada mulanya, optical character recognition (menggunakan teknik optik seperti cermin dan lensa) dan digital character recognition (menggunakan scanner dan algoritma komputer) merupakan dua bidang kajian yang terpisah. Karena hanya sedikit aplikasi yang benar-benar menggunakan teknik optik, istilah OCR akhirnya meluas, termasuk ke dalamnya digital image processing

Awal Mula OCR
OCR kali pertama dipatenkan oleh Gustav Tauschek di Jerman pada 1929, kemudian diikuti oleh Handel di AS pada 1933. Mesin buatan Tauschek adalah perangkat mekanik yang menggunakan template. Sebuah photodetector ditempatkan pada mesin tersebut Untuk mengenali sebuah karakter, template diletakkan tepat di atas mesin tersebut, kemudian disinari. Bayangan yang terbentuk pada photodetector akan dikenali sebagai karakter tertentu. Pada 1950, David Shepard, seorang ahli sandi dari badan intelijen angkatan bersenjata AS, menemukan Intelligent Machines Research Corporation (IMR), yang kemudian hari menjelma menjadi sistem OCR pertama yang dikomersialkan. IMR menggunakan analisis image sebagai lawan dari ketepatan karakter, dan dapat mengenali beberapa varian font. Scanner yang telah dilengkapi dengan sistem IMR mampu menganalisis karakter. OCR komersial pertama digunakan oleh Readers Digest pada 1955. Sistem OCR kedua dijual kepada Standard Oil Company di California untuk membaca cetakan kartu kredit untuk keperluan pembayaran. Pada era 1950-an, beberapa sistem OCR juga digunakan oleh Ohio Bell Telephone Company, IBM, dan Angkatan Udara AS untuk membaca dan mengirimkan pesan yang diketik melalui teletype.

Teknologi OCR Sekarang
Tingkat akurasi OCR sekarang terhadap tulisan latin yang diketik dapat dikatakan telah sempurna, mencapai 99%. Walaupun demikian, review dari manusia tetap dibutuhkan untuk mengoreksi kesalahan yang ditimbulkan selama proses penerjemahan berlangsung. Sistem untuk mengenali tulisan tangan secara langsung (on the fly) yang dipelopori oleh The Apple Newton telah menikmati kesuksesan di pasar dalam beberapa tahun belakangan. Di antaranya adalah perangkat input untuk PDA yang bekerja pada Palm OS. Algoritma yang digunakan perangkat ini memanfaatkan fakta bahwa gerakan, kecepatan dan arah yang digunakan oleh orang, saat menulis sebuah huruf memiliki banyak kesamaan dan telah dikenali. Metode yang digunakan pada perangkat input PDA ini tidak dapat digunakan dalam software untuk men-scan kertas dokumen. Sampai saat ini, tingkat akurasi tulisan tangan masih menjadi kendala besar dalam sistem OCR. Tingkat akurasi yang mencapai 80% hingga 90% masih dapat diterima untuk penggunaan skala kecil seperti menulis di PDA, tetapi masih belum dapat diterima untuk dokumen dalam jumlah yang besar. Varian OCR yang digunakan untuk mengenali tulisan tangan on the fly ini dikenal dengan nama ICR (Intelligent Character Recognition). Sementara itu, pengenalan tulisan tangan sambung masih berada dalam kancah riset aktif sampai saat ini. Tingkat akurasi untuk tulisan tangan sambung yang telah dicapai

masih di bawah tingkat akurasi tulisan tangan yang tidak disambung. Kenaikkan peningkatan pengenalan tulisan rasanya sulit dicapai, kecuali memasukkan unsur lain dalam OCR, yakni informasi kontekstual atau gramatikal. Sebagai contoh, pengenalan kata yang ada dalam kamus jauh lebih mudah ketimbang mencoba mengenali tulisan tangan setiap orang. Membaca kolom nilai dalam cek atau kuitansi (yang biasanya ditulis dengan angka) adalah contoh sederhana bagaimana menggunakan kamus kecil dapat menaikkan tingkat akurasi secara signifikan. Pengetahuan gramatika dari sebuah bahasa yang akan di-scan juga dapat menentukan apakah kata yang ditulis merupakan kata kerja atau kata benda. Bentuk tulisan tangan sambung sendiri sama sekali tidak memberikan informasi yang cukup untuk menaikkan tingkat akurasi. Jika nantinya para ilmuwan benar memasukkan pengenalan gramatika bahasa, maka OCR merupakan teknologi hibrid hasil persilangan antara teknik optik, algoritma komputer, dan linguistik.
Categories:

3 komentar:

hack87 said...

memang kita harus mempergunakan teknologi yang ada, makin melek teknologi makin cerdas kehidupan ini.

Syah69 said...

100% buat commandan

Muhammad Syahrul II said...

mas, mau nanya tentang tesseract OCR..
udah pernah nyoba trainingnya gak mas?
artinya ane mau make OCR dari koran yang noise nya banyak..
terimakasih