Uczenie półnadzorowane – połączenie danych etykietowanych i nieetykietowanych.

Uczenie półnadzorowane jest techniką w dziedzinie sztucznej inteligencji, która wykorzystuje jednocześnie dane etykietowane oraz nieetykietowane w procesie treningu modelu. Podejście to stanowi kompromis pomiędzy uczeniem nadzorowanym, które opiera się wyłącznie na danych z przypisanymi etykietami, a uczeniem nienadzorowanym, gdzie dane nie posiadają informacji o klasach czy kategoriach. Dzięki zastosowaniu danych nieetykietowanych możliwe jest wykorzystanie większych zbiorów danych, często dostępnych w sposób nieograniczony, co pozwala zwiększyć efektywność i dokładność modeli przy ograniczonej liczbie danych oznaczonych.

W praktyce uczenie półnadzorowane polega na wykorzystaniu małego zestawu danych etykietowanych do nadzorowania procesu klasyfikacji lub innej formy analizy, a następnie na wykorzystaniu informacji zawartych w danych nieetykietowanych do wzmocnienia modelu. Metody te mogą wykorzystywać różnorodne techniki, takie jak autoenkodery, propagacja etykiet, metody samouczące się czy modele oparte na grafach. Dzięki temu możliwe jest skuteczniejsze wykorzystanie dostępnych danych oraz uzyskanie wysokiej jakości wyników nawet przy ograniczonych kosztach związanych z ręcznym oznaczaniem danych.

Uczenie półnadzorowane znajduje zastosowanie w wielu dziedzinach, gdzie pozyskanie etykietowanych danych jest kosztowne lub czasochłonne, np. w rozpoznawaniu obrazów, przetwarzaniu języka naturalnego, czy systemach rekomendacyjnych. Dzięki łączeniu informacji z obu typów danych jest to efektywne narzędzie umożliwiające rozwój systemów sztucznej inteligencji o zwiększonej precyzji i zdolności generalizacji.