Kolmogorov-Arnold Networks (KAN) – alternatywa dla tradycyjnych sieci wielowarstwowych.
Model wywodzący się z teorii funkcji ciągłych, oparty na twierdzeniu Kolmogorova-Arnolda, które gwarantuje możliwość reprezentacji dowolnej funkcji wielowymiarowej za pomocą sumy funkcji jednowymiarowych. Sieci oparte na tym podejściu różnią się od tradycyjnych sieci wielowarstwowych strukturą, w której funkcje aktywacji są ułożone zgodnie z dekompozycją zgodną z twierdzeniem, co pozwala na bardziej analityczną interpretację ich działania.
Zastosowanie tego modelu w uczeniu maszynowym oznacza, że funkcje reprezentowane przez sieć są sumą prostszych funkcji jednowymiarowych, co może prowadzić do lepszej ogólności i stabilności modelu oraz ograniczenia typu problemów z lokalnymi minimami podczas uczenia. W praktyce sieci te stanowią alternatywę dla klasycznych głębokich sieci neuronowych, zwłaszcza tam, gdzie istotna jest czytelność architektury i interpretowalność modelu.