Softmax – funkcja zamieniająca wynik na prawdopodobieństwo.
Jest to funkcja matematyczna stosowana w uczeniu maszynowym i sieciach neuronowych, służąca do przekształcania wektora wyników (logitów) modelu na rozkład prawdopodobieństwa. Działanie tej funkcji polega na obliczeniu wykładnika każdej wartości wejściowej i znormalizowaniu ich przez sumę wszystkich wykładników, co zapewnia, że suma wszystkich wyjściowych wartości wynosi jeden. W efekcie uzyskane wartości można interpretować jako prawdopodobieństwa przynależności do poszczególnych klas.
Funkcja odgrywa kluczową rolę w zadaniach klasyfikacji wieloklasowej, gdzie model musi wskazać najbardziej prawdopodobną kategorię spośród wielu możliwych. Stosowana jest zazwyczaj jako ostatnia warstwa w sieciach neuronowych, umożliwiając interpretację wyników w sposób probabilistyczny oraz ułatwiając proces uczenia przez minimalizację funkcji straty opartej na entropii krzyżowej. Dzięki temu można porównywać przewidywania modelu z rzeczywistymi etykietami i optymalizować parametry modeli w celu poprawy ich skuteczności.