Feature Engineering – proces wybierania i tworzenia cech dla modelu.

Proces ten polega na selekcji, transformacji oraz tworzeniu odpowiednich zmiennych (cech) z surowych danych, które następnie służą jako wejście do modeli uczenia maszynowego. Celem jest uzyskanie reprezentacji danych, która w maksymalnym stopniu umożliwi modelowi wykrywanie istotnych wzorców i zależności, co przekłada się na poprawę jakości prognoz i klasyfikacji.

W praktyce obejmuje on szereg technik, takich jak skalowanie, kodowanie zmiennych kategorycznych, ekstrakcja cech z tekstu czy obrazów oraz tworzenie nowych atrybutów poprzez działania matematyczne bądź statystyczne. Efektywne przeprowadzenie tego procesu wymaga wiedzy zarówno z zakresu domeny problemu, jak i metod analizy danych, aby wyselekcjonować najbardziej reprezentatywne i jednocześnie odrzucić nieistotne lub szkodliwe cechy.