OCR (Optical Character Recognition) – rozpoznawanie tekstu ze zdjęć.

Technologia rozpoznawania tekstu ze zdjęć, zwana OCR (Optical Character Recognition), umożliwia automatyczne przekształcanie obrazów zawierających tekst, takich jak zeskanowane dokumenty, fotografie czy wydruki, na postać cyfrową możliwą do edycji i przeszukiwania. Proces ten polega na identyfikacji znaków alfanumerycznych oraz ich konwersji do formatu tekstowego poprzez analizę wzorców, struktur znaków oraz kontekstu układu dokumentu.

Metody stosowane w rozpoznawaniu tekstu bazują na algorytmach uczenia maszynowego i sieciach neuronowych, które z każdą iteracją poprawiają skuteczność odczytu różnorodnych czcionek, stylów pisma i jakości obrazów. OCR znajduje zastosowanie w digitalizacji archiwów, automatyzacji procesów biurowych, transkrypcji materiałów prasowych, a także w systemach umożliwiających szybkie wyszukiwanie informacji w dokumentach fizycznych przekształconych do formy elektronicznej.