Outlier (Wartość odstająca) – dane znacząco odbiegające od normy.

Outlier, zwany również wartością odstającą, to obserwacja lub punkt danych, który znacząco różni się od pozostałych elementów zbioru danych. Wartości te znajdują się poza typowym zakresem rozkładu danych i mogą wynikać z różnych przyczyn, takich jak błędy pomiarowe, zakłócenia środowiskowe lub rzeczywiste, ale rzadkie zdarzenia. Ich obecność może wpływać na wyniki analizy, modelowania i uczenia maszynowego, dlatego wykrywanie i interpretacja outlierów jest istotnym etapem w procesie przetwarzania danych.

W kontekście sztucznej inteligencji oraz analizy danych outliery mogą negatywnie wpływać na dokładność modeli predykcyjnych i klasyfikacyjnych, prowadząc do zniekształceń wyników lub błędnych wniosków. W zależności od zastosowania, wartości odstające mogą być usuwane, korygowane lub poddawane dalszej analizie w celu zrozumienia ich genezy i znaczenia. Wykorzystuje się do tego różnorodne metody statystyczne, techniki uczenia nienadzorowanego czy specjalistyczne algorytmy wykrywania anomalii.