F1 Score – średnia harmoniczna z precyzji i czułości.

Jest to miara wykorzystywana w statystyce oraz w dziedzinie uczenia maszynowego do oceny skuteczności klasyfikatorów binarnych oraz wieloklasowych. Pozwala na zrównoważenie dwóch podstawowych wskaźników jakości klasyfikacji: precyzji (ang. precision) oraz czułości (ang. recall, zwanej również pełnością).

Wartość tego wskaźnika obliczana jest jako średnia harmoniczna precyzji i czułości, co powoduje, że jest ona bardziej wrażliwa na niskie wartości obu tych miar. Dzięki temu jeśli precyzja lub czułość są niskie, wynik również będzie niski, co pomaga uniknąć sytuacji, w których wysoka wartość jednej z tych miar maskowałaby słabość drugiej. Stosowany jest powszechnie w zadaniach klasyfikacji, zwłaszcza tam, gdzie ważne jest zbalansowanie fałszywych alarmów i pominięć, np. w medycznej diagnostyce komputerowej, systemach rozpoznawania obrazów czy analizie tekstów.

Jego wartość mieści się w przedziale od 0 do 1, gdzie 1 oznacza idealną zgodność klasyfikacji z rzeczywistymi etykietami. W porównaniu do prostych wskaźników, takich jak dokładność, uwzględnia zarówno błędy typu fałszywie pozytywne, jak i fałszywie negatywne, co czyni go bardziej reprezentatywnym miarą jakości modelu w niejednorodnych zbiorach danych.