Quantization (Kwantyzacja) – zmniejszanie precyzji wag w celu przyspieszenia modelu.

Proces zmniejszania precyzji wartości liczbowych reprezentujących parametry modelu, takich jak wagi sieci neuronowej, w celu redukcji ilości danych potrzebnych do ich przechowywania i przetwarzania. Technika ta pozwala na obniżenie wymagań pamięciowych oraz skrócenie czasu wykonywania operacji obliczeniowych, co przekłada się na przyspieszenie działania modelu, szczególnie na urządzeniach o ograniczonych zasobach obliczeniowych.

Kwantyzacja prowadzi do zastąpienia liczb zmiennoprzecinkowych o wysokiej precyzji wartościami o niższym rozdzielczości, zwykle w formacie całkowitoliczbowym, co może nieznacznie wpłynąć na dokładność modelu. Metody kwantyzacji mogą obejmować różne stopnie redukcji bitów, takie jak 8-bitowa kwantyzacja, a nawet bardziej agresywne podejścia, które są dobierane w zależności od wymagań aplikacji i tolerancji na spadek jakości. Zastosowanie kwantyzacji jest kluczowe w praktycznych wdrożeniach sztucznej inteligencji, umożliwiając efektywne wykorzystanie modeli na urządzeniach mobilnych, IoT oraz w systemach czasu rzeczywistego.