Stemming – obcinanie końcówek słów.

Jest to technika przetwarzania języka naturalnego polegająca na redukcji wyrazów do ich podstawowej formy poprzez usunięcie końcówek fleksyjnych i derywacyjnych. Celem tej operacji jest sprowadzenie różnych form tego samego słowa do jednego, wspólnego rdzenia, co ułatwia analizę tekstu, wyszukiwanie informacji oraz przetwarzanie danych lingwistycznych. Metoda ta jest powszechnie wykorzystywana w systemach wyszukiwania, analizie sentymentu, automatycznym tłumaczeniu oraz w innych zastosowaniach związanych ze sztuczną inteligencją.

Podstawową różnicą między obcinaniem końcówek a lematyzacją jest to, że stemming operuje na poziomie prostych reguł lub algorytmów, często bez uwzględniania kontekstu czy pełnej analizy gramatycznej słowa. Dzięki temu jest szybki i prosty, ale może prowadzić do powstawania form nieistniejących w języku naturalnym, więc wymaga kompromisu między dokładnością a efektywnością. W praktyce do obcinania końcówek stosuje się różnorodne algorytmy, takie jak np. algorytm Portera, które różnią się stopniem złożoności i dostosowania do konkretnego języka.