OCR Nedir?

OCR (optical character recognition) teknolojisi taranmış bir metin gibi fiziksel belgelerin dijital görsellerini okuyup metindeki farklı karakterleri, görselleri, kelimeleri ayırt eder. OCR programları bu bilgileri alarak makine tarafından okunabilen dijital bir veri formatına dönüştürür. Basitçe ifade etmek gerekirse, çekilen görüntü işlenir, karakterler çıkarılır ve ardından tanınır. OCR sistemleri fiziksel belgeleri makine tarafından okunabilir bir hedef metne dönüştürmek için bir donanım ve yazılım kombinasyonu kullanır. Optik tarayıcı ve özel devre kartı gibi donanım metinleri okumak için kullanılırken, yazılım gelişmiş işlemler ile uğraşır.

Özetle, fiziksel belgelerin farklı karakter, görsel ve kelimeleri ayırt edip dijital ortama aktarılmasını sağlayarak insan hayatını kolaylaştıran bir teknolojidir.

OCR Programları

OCR teknolojisini kullanmak isteyenlerin kendileri için en doğru program seçimini yapmaları önemlidir. Bu programların en ünlülerinden biri olan Tesseract 2006 yılından beri Google’ın sponsorluğu altında çalışmaktadır. Ücretsiz ve hızlıdır ancak mobil desteği yoktur ve kullanıcının isteklerine göre kişiselleştirilmesi zordur. Bir diğer program olan ABBYY Finereader, düzenleme yapmak için metinlerin okunmasını kolay ve eforsuz hale getirir. Ücretli olması ile birlikte hızlı ve kullanışlıdır. Bu programların yanında internet üzerinden metin tanıma yapan birçok web sitesi vardır. Ücret ödemek istemeyen veya daha basit ihtiyaçları olan kullanıcıların bu sitelere dijital ortama çevirmek istedikleri metinin fotoğrafını yüklemeleri yeterli olacaktır.

OCR Algoritmaları

İki çeşit OCR algoritması vardır. Bu algoritmaların ilki matris eşleştirmedir. Matris eşleştirme, bir görüntünün programda depolanan bir glif ile piksel bazında karşılaştırılmasını içerir. Bu yöntem görüntüde tanınmaya çalışılan karakterin benzer bir yazı tipinde ve aynı ölçekte glifte bulunmasına dayanır. Matris eşleştirme en iyi daktilo ile yazılan metinlerde çalışır ve yeni yazı tipleri ile karşılaştığında verimliliğini kaybeder. Fotosel tabanlı OCR nin kullandığı teknik budur.

İkinci algoritma ise özellik çıkarmadır. Özellik çıkarma, glifleri çizgiler, eğriler, çizgi yönü ve çizgi kesişimleri gibi özelliklere ayırır. Bu çıkarma işlemi temsilin boyutluluğunu azaltır ve tanıma sürecini verimli hale getirir. Bu özellikler bir veya daha fazla glif prototipine indirgenebilen bir karakterin soyut vektör benzeri temsiliyle karşılaştırılır. Bu teknik birçok modern OCR programında ve el yazısı tanımada kullanılır.

OCR’ın Kullanıldığı Alanlar

OCR hayatımızda birçok alanda işlemleri hızlandırmak amacıyla kullanılır. Bu teknolojinin otomatik plaka tanıma gibi insanlar tarafından yapılamayacak işleri mümkün kılmasının yanında yazılı belgelerin insanların hiçbir zaman ulaşamayacakları hızlarda dijital ortama aktarılmasını sağlar. Bu teknolojinin kullanıldığı diğer alanlar; çek, pasaport, fatura ve fiş gibi iş belgeleri için veri girişi, havaalanlarında pasaport tanıma, trafik işareti tanıma, iş kartı bilgilerinin kişiler listesine çıkarılması, yazılı belgelerin daha hızlı bir şekilde dijital ortama aktarılması, el yazısının eşzamanlı olarak dijital bir ortama aktarılması ve görme engelli kullanıcılar için destek uygulamaları olarak ayrılabilir. İlgili olunan alana göre kullanılan OCR algoritması ve programı değişecektir.

Mizanpaj kapsamında sunululan OCR hizmeti için bize ulaşabilirsiniz.

OCR Programları

OCR Algoritmaları

OCR’ın Kullanıldığı Alanlar

Diğer yazılar