Imbalanced Classes – problem, gdy jedna kategoria danych jest znacznie liczniejsza od innych.

Problem niezrównoważonych klas występuje w uczeniu maszynowym i sztucznej inteligencji, gdy w zbiorze danych jedna lub kilka kategorii ma znacząco więcej przykładów niż pozostałe. Taka nierównowaga prowadzi do sytuacji, w której algorytmy uczące się mogą faworyzować przewagę liczebną dominującej klasy, kosztem poprawnej identyfikacji mniejszościowych kategorii. W rezultacie model może osiągać wysoką ogólną dokładność, lecz jednocześnie mieć słabe zdolności rozróżniania dla rzadziej występujących klas.

Problem ten jest szczególnie istotny w zastosowaniach, gdzie klasy mniejszościowe są kluczowe z punktu widzenia zastosowań praktycznych, na przykład w wykrywaniu oszustw, diagnozowaniu chorób lub systemach bezpieczeństwa. W celu przeciwdziałania negatywnym skutkom nierównej reprezentacji klas stosuje się różnorodne metody, takie jak nadpróbkowanie mniejszościowych klas, podpróbkowanie klasy dominującej, generowanie syntetycznych przykładów (np. technika SMOTE) lub modyfikacja funkcji kosztu podczas trenowania modelu. Dzięki temu możliwe jest tworzenie bardziej zrównoważonych, a co za tym idzie, bardziej wiarygodnych i użytecznych modeli predykcyjnych.