One-Hot Encoding – zamiana kategorii na wektory zer i jedynek.
Metoda polegająca na reprezentowaniu wartości kategorycznych za pomocą wektorów binarnych, w których każda pozycja odpowiada jednej kategorii. W takim wektorze tylko jeden element przyjmuje wartość 1, wskazując obecność danej kategorii, a pozostałe są zerami, co umożliwia numeryczne przetwarzanie danych kategorycznych przez algorytmy uczenia maszynowego. Liczba pozycji w wektorze odpowiada liczbie unikalnych kategorii w danym zbiorze danych.
Technika ta eliminuje potrzeby porządkowania kategorii i zapobiega interpretacji relacji porządkowych pomiędzy nimi, co mogłoby nastąpić przy użyciu metod kodowania liczbowego. Jest szeroko stosowana w dziedzinach takich jak analiza danych, przetwarzanie języka naturalnego czy sieci neuronowe, pozwalając algorytmom efektywniej pracować z danymi jakościowymi. Warto jednak pamiętać, że przy dużej liczbie kategorii metoda może generować rzadkie (sparse) i bardzo wymiarowe reprezentacje.