Object Detection – wykrywanie i lokalizowanie obiektów na zdjęciu.

Jest to dziedzina w ramach sztucznej inteligencji i widzenia komputerowego zajmująca się identyfikacją oraz określaniem pozycji wybranych obiektów na obrazach lub w strumieniach wideo. Proces ten obejmuje nie tylko rozpoznanie, jakie obiekty znajdują się w danym kadrze, ale również precyzyjne wyznaczenie ich lokalizacji za pomocą współrzędnych prostokątnej ramki (bounding box) lub innej reprezentacji geometrycznej. Techniki wykrywania obiektów opierają się na metodach uczenia maszynowego, w szczególności głębokich sieciach neuronowych, które umożliwiają skuteczne i szybkie przetwarzanie obrazów.

W praktyce wykrywanie i lokalizowanie obiektów znajduje zastosowanie w wielu dziedzinach, takich jak systemy nadzoru wizyjnego, autonomiczne pojazdy, robotyka, a także w analizie obrazu medycznego czy rozpoznawaniu twarzy. Modele wykrywania obiektów są uczone na dużych zbiorach danych zawierających przykłady różnych kategorii obiektów, co pozwala im na generalizację i skuteczne działanie w nowych, wcześniej nieznanych warunkach. Metody te obejmują m.in. algorytmy takie jak R-CNN, YOLO czy SSD, które różnią się podejściem do generowania propozycji lokalizacji i szybkością działania.

Ważnym aspektem jest również zdolność do wykrywania wielu obiektów jednocześnie oraz radzenie sobie z przesłonięciami, różnorodnością skal czy oświetlenia. Wykrywanie i lokalizowanie obiektów stanowi bazę dla bardziej zaawansowanych zadań w dziedzinie wizji komputerowej, takich jak segmentacja semantyczna czy śledzenie ruchu obiektów w czasie. Rozwój tej technologii wpływa istotnie na postęp w automatyzacji wielu procesów oraz na poprawę interakcji człowiek–maszyna.