Szukaj

Posty RSS

Komentarze RSS

 

Google OCR

cze 28

Już od ponad roku rozwijana jest funkcja OCR dostępna z poziomu Google Docs.
Dzięki niej możemy wysyłać pliki PDF oraz pliki graficzne i otrzymać całkiem nieźle rozpoznany dokument w formie edytowalnej.Nie dziwi mnie fakt wprowadzenia takiej funkcji przez Google.

Wszystko wiąże się z analizą tekstu i tłumaczeniami.

Google jako firma, która posiada dostęp do ogromnej ilości danych nie musi pisać skomplikowanych algorytmów rozpoznawania tekstu jakimi może poszczycić się Abyy FineReader.

Firma Abyy rozwija swoją aplikację od lat.

Na chwilę obecną ;) FineReader to jeden z najlepszych programów do OCRu na rynku.

Google wpadło jednak na lepszy pomysł.

Podpisali umowy z wydawcami, autorami książek na digitalizację ich utworów.

Kupili system reCaptcha, który sam w sobie jest jednym z trybików Google OCR.

Co to jest reCaptcha?Kiedyś już o tym pisałem ;)

http://www.atominium.com/blog/2009/09/24/google-kupilo-recaptcha/

Udostępniają za darmo Google Translate, który z dnia na dzień zbiera coraz więcej informacji.

Usługi od Google mają na celu zebranie jak największej ilości danych i wykorzystanie ich w innych usługach jak choćby OCR.

Tak jak przy Google Translator korzystają oni z algorytmów statystycznych.

W przypadku Google jest to bardzo dobre rozwiązanie, ponieważ takie algorytmy są o wiele prostsze do zaimplementowania niż prawdziwe algorytmy OCR.

Za kilka lat możemy spodziewać się OCRu tak dokładnego, że żaden inny program nie będzie w stanie dorównać machinie zwaną Google.

Podziel się na:
  • Facebook
  • Wykop
  • Twitter
  • Blip
  • Digg
  • Technorati
  • del.icio.us
  • Blogger.com
  • LinkedIn

Komentarze zostały zamknięte.

 
Atominium © www.atominium.com