Dimensionality Reduction – upraszczanie danych przy zachowaniu kluczowych cech.

Proces mający na celu przekształcenie danych wielowymiarowych w przestrzeń o niższej liczbie wymiarów, przy jednoczesnym zachowaniu najistotniejszych informacji i wzorców zawartych w oryginalnym zbiorze danych. Stosowany jest w celu uproszczenia analizy, wizualizacji oraz zwiększenia efektywności algorytmów uczenia maszynowego, eliminując jednocześnie redundancje i szumy. Pozwala na zmniejszenie złożoności modeli oraz skrócenie czasu obliczeń, jednocześnie minimalizując utratę istotnych cech danych.

Techniki redukcji wymiarowości obejmują metody liniowe, takie jak analiza głównych składowych (PCA), oraz metody nieliniowe, przykładowo t-SNE czy autoenkodery. Wybór odpowiedniej metody zależy od charakterystyki danych oraz celu analizy. Efektywne upraszczanie danych umożliwia lepsze zrozumienie struktury danych, ułatwiając wykrywanie zależności oraz klasteryzację, a także wspiera procesy predykcyjne w systemach sztucznej inteligencji.