Doavers

Kreasikan Inspirasimu

, , ,

Deteksi Teks pada Gambar Menggunakan OCR

Optical Character Recognition OCR

OCR (Optical Character Recognition) adalah teknologi yang memungkinkan Anda untuk mengkonversi berbagai jenis dokumen, seperti dokumen kertas yang dipindai, file PDF atau gambar yang diambil oleh kamera digital menjadi data yang dapat diedit dan dicari.

Secara harfiah, OCR adalah singkatan dari Optical Character Recognition. Ini adalah teknologi luas untuk mengenali teks di dalam gambar, seperti dokumen dan foto yang dipindai. Teknologi OCR digunakan untuk mengubah hampir semua jenis gambar yang mengandung teks tertulis (diketik, tulisan tangan atau dicetak) menjadi data teks yang dapat dibaca mesin.

 Teknologi OCR menjadi populer di awal 1990-an ketika berusaha mendigitalkan surat kabar bersejarah. Sejak itu teknologi telah mengalami beberapa perbaikan. Saat ini solusi menghadirkan akurasi OCR yang mendekati sempurna. Metode canggih seperti Zonal OCR digunakan untuk mengotomatisasi alur kerja berbasis dokumen yang kompleks

Kasus penggunaan populer untuk teknologi OCR

Mungkin use case yang paling terkenal untuk OCR adalah mengubah dokumen kertas cetak menjadi dokumen teks yang dapat dibaca mesin. Setelah dokumen kertas yang dipindai melewati pemrosesan OCR, teks dokumen dapat diedit dengan pengolah kata seperti Microsoft Word atau Google Documents. Sebelum teknologi OCR tersedia, satu-satunya pilihan untuk mendigitalkan dokumen kertas tercetak adalah mengetik ulang teks secara manual. Ini tidak hanya menghabiskan banyak waktu, tetapi juga disertai dengan ketidakakuratan dan kesalahan pengetikan.

 OCR sering digunakan sebagai teknologi “tersembunyi“, memberi daya pada banyak sistem dan layanan terkenal dalam kehidupan kita sehari-hari. Teknologi kurang dikenal, tetapi yang terpenting kasus penggunaan untuk teknologi OCR termasuk otomatisasi entri data, pengindeksan dokumen untuk mesin pencari, pengenalan plat nomor otomatis, serta membantu orang buta dan tunanetra.

Teknologi OCR telah terbukti sangat berguna dalam mendigitalkan surat kabar dan teks bersejarah yang kini telah dikonversi ke dalam format yang sepenuhnya dapat dicari dan telah membuat mengakses teks-teks sebelumnya lebih mudah dan lebih cepat.

1. Meratakan gambar (Auto Deskewing)

File image (gambar) akan diatur kemiringannya, apabila hasil scan ada kemiringan, maka gambar akan dibuat sejajar atau lurus.

AD 4nXev GFLZkXfyNbWRhQj3KBNxhUiblT0KLwcxuKKVsQB gEcRf9LGPo irBtFysWNb2mjbaY41uz6L82b6DSVsh6tg5niGpsyS20Y 2rNLRP4Yau fkeqgSvewDG2shhiG5WvxyTS 0y5u5PZ5Qy07Ab6fo?key=43mIwpc 6aBn47StbqZKjg

2. Menganalisa (Analysis)

Software (program) OCR akan menganalisa dan memisahkan bagian teks dan bagian gambar.

AD 4nXfNt5tyY TXy61IX3xn9VDTDiMDuNqz2o5L3HGGDkKwV7esBZof5xJjAR1r9rQDG4vi W8BLGBov1L0uIHuuuPFc31W5a3Y3FfEfHEZk 33rJW2I3m87Lax8gALpa27nvF9xTxofjfk9Bay8Rw0feJwqm8?key=43mIwpc 6aBn47StbqZKjg

3. Otomatis mengatur arah gambar (Auto Orientation)

Software (program) OCR akan mengambil sebagian area pada file image (gambar) dan mengidentifikasi arah teks yang benar. File image (gambar) akan diputar ke arah yang benar, pilihannya adalah 90°, 180°, atau 270°.

AD 4nXd9Se6zPZvLHfqVlusBvH8T5xVzxqbZoLFYYwHQGdTaineGJzn5N w1Lcf2Nh61mhV3iF3SNZdJbljqzQ5huoCRhg8oEt105JImvrgsXnfPH3ktLCxtYw2NaTJDUu8Fu1Ys3bJ8jNjPN Gova2S7xDAZv0?key=43mIwpc 6aBn47StbqZKjg

4. Memisahkan setiap karakter huruf dan angka (Separating single character)

Software (program) OCR akan memisahkan setiap karakter yang terdapat pada image (gambar) menjadi sebuah huruf atau angka.

AD 4nXdsYqeG9bGpxBTfkuLl0kEWz76odr86eMjGvyDlNflF3LefBOX6p0dLdHbuNngOdxn3uxMx5UlFFcXNQ7TvXqotWYgMxuE LeTe7QqSU3OfuOJge 10ddYDK8UgrZ4xq8nPgfwMyXi5xkP76ttW0AvbyA?key=43mIwpc 6aBn47StbqZKjg

5. Mengidentifikasi gambar (Capturing the features of the characters and comparing)

Software (program) OCR akan mengidentifikasi satu persatu setiap gambar yang sudah dipisahkan, dan melakukan pengecekan terhadap database yang dimiliki oleh software (program) OCR, dan menetapkan huruf atau angka yang akan digunakan.

AD 4nXeVk Vx2h6TkH5q1SM sAcahCUxjTcxm12JvQOCg4TV8Lc86STJPObfwnccOgqZWJWtwwxOiVeMR3jD23hUuwrToPTvFP5YmtptXKKD2E7mpYO5V8mdS 5aOLw7smx2iEefreFQ7dKHVr2w7m1NrfaGbQ?key=43mIwpc 6aBn47StbqZKjg

6. Menghasilkan file akhir (Recognition result output)

Setelah setiap image (gambar) sudah dirubah menjadi huruf atau angka (format teks) maka software (program) OCR akan menghasilkan sebuah file dengan format teks, seperti Microsoft Word, Microsoft Excel, TXT, Rich Text dan Searchable PDF, tergantung dari pengaturan awal.

AD 4nXf30QGVdwwE05DArc72ieHLy29TpL1 jreaBNd2LHZrRi7sf 3fvEppVP33oSuIGJbG6stLQnMogB7M 9NlMVkRv2WwZvWxigwMV87 PtVmfisgA7WIlaii76JQ6iWI9uLaB6NL7ZEG4sCag eX SMqQ0k?key=43mIwpc 6aBn47StbqZKjg

Nah, begitulah cara kerja OCR hingga dapat mendeteksi teks pada gambar menjadi teks digital. 

https://www.abbyy.com/en-us/finereader/what-is-ocr

Comments

Leave a Reply

Your email address will not be published. Required fields are marked *