Data Augmentation – sztuczne powiększanie zbioru danych (np. przez obracanie zdjęć).

Data Augmentation to technika wykorzystywana w uczeniu maszynowym i sztucznej inteligencji, polegająca na sztucznym powiększaniu zbioru danych treningowych poprzez wprowadzanie różnych transformacji istniejących próbek. Celem tego procesu jest zwiększenie różnorodności danych, co pozwala na poprawę ogólnej jakości modelu oraz jego odporności na przeuczenie. W kontekście analizy obrazów popularne metody obejmują obracanie, skalowanie, przesuwanie, odbicia lustrzane czy zmiany jasności i kontrastu.

Stosowanie sztucznego powiększania danych jest szczególnie istotne w sytuacjach, gdy dostępne zbiory są ograniczone lub trudne do zebrania, co może wpływać na efektywność trenowania modeli. Dzięki Data Augmentation modele uczą się rozpoznawać istotne cechy niezależnie od wariantów wejściowych, co zwiększa ich uniwersalność i zdolność generalizacji. Technika ta jest szeroko wykorzystywana w dziedzinach takich jak rozpoznawanie obrazów, przetwarzanie języka naturalnego czy synteza mowy.