Microsoft Cognitive Service, Computer Vision API ile OCR | Mesut Pişkin

Microsoft Cognitive Service, Computer Vision API ile OCR

Microsoft Computer Vision API – C# Kullanarak OCR Microsoft yakın zamanda geliştirici konferansında Cognitive Services adı altında bir dizi hizmet paketini kullanıma açmıştı. Bu hizmet paketleri içerisinde görüntü işleme, ses işleme, derin öğrenme, metin işleme ve ekstra arama hizmetleri gibi çeşitli servisler yer almaktadır. Sağlanan bu hizmetlerin bir çoğunu bulut üzerinden sunmaktadır ve belirli bir işlem hacmine kadar ücretsizdir. Değineceğimiz OCR ve diğer servisleri, ticari projelerde veya çok fazla işlemeye ihtiyaç duyulan projelerde satın almanızı öneririm. OCR Optical character recognition kelimelerinin kısaltmasıdır yani optik karakter tanıma olarak dilimize çevrilmektedir. Bir görsel veya metinsel halde olmayan dokümanı metin olarak elde etmeye yarayan yöntemdir. Bu bağlamda bir çok algoritma mevcut ve bu farklı algoritmaları kullanan ücretli veya ücretsiz bir çok kütüphane, servis bulunmaktadır. Açık kaynak kodlu ve ücretsiz bir kütüphane olan tesseract çok fazla kullanılan OCR kütüphanelerinden birisidir. Bu yazımızda Microsoft’un hizmeti olan Microsoft Computer Vision API ile gelen OCR hizmetini kullanacağız. Microsoft bu hizmeti AZURE üzerinde yer alan Web Servisi ile veriyor. Yani OCR işlemleri için sürekli olarak bir web servisine istekte bulunacak ve bize gelen JSON veriyi parçalayarak ayrıştıracağız. Daha önce web servislerini kullanmadıysanız endişelenmeyin Microsoft kullanımı oldukça kolaylaştıran açık kaynak kod bir kütüphanede geliştirmiştir. İki yöntemide kullanarak görsellerimize ocr …