Data Drift (Dryf danych) – zmiana rozkładu danych wejściowych w czasie.
Data Drift, nazywany również dryfem danych, odnosi się do zjawiska zmiany rozkładu danych wejściowych wykorzystywanych przez modele uczenia maszynowego w czasie. Taki dryf może występować wskutek ewolucji środowiska, zmian w zachowaniach użytkowników lub modyfikacji systemu generującego dane. Skutkuje to sytuacją, w której dane przyszłe różnią się statystycznie od danych, na których model był trenowany, co może prowadzić do pogorszenia jakości predykcji i spadku efektywności działania algorytmów.
Monitorowanie i identyfikacja dryfu danych są kluczowymi etapami w procesie utrzymania modeli sztucznej inteligencji. Wykorzystuje się różne techniki detekcji, takie jak analizy statystyczne rozkładów cech, testy hipotez czy metody uczenia maszynowego dostosowane do identyfikacji zmienności danych wejściowych. Zarządzanie dryfem obejmuje zarówno automatyczne aktualizacje modeli, jak i interwencje analityczne, mające na celu dostosowanie modelu do nowych warunków, co pozwala na zachowanie wysokiej jakości predykcji w dynamicznie zmieniającym się środowisku.