Stop words – popularne słowa (np. "i", "w") usuwane podczas analizy.

Stop words to popularne słowa, które w procesie analizy tekstu są zwykle usuwane, ponieważ nie niosą istotnej informacji semantycznej. Przykładami takich wyrazów są spójniki, przyimki, zaimki czy partykuły, jak na przykład „i”, „w”, „na”, „z”. Ich obecność może zakłócać efektywność różnych operacji przetwarzania języka naturalnego, takich jak indeksowanie, wyszukiwanie czy klasyfikacja tekstu.

Usuwanie stop words pozwala na skupienie się na słowach niosących większą wartość informacyjną i ułatwia zautomatyzowaną analizę danych tekstowych. Lista stop words nie jest uniwersalna i może się różnić w zależności od języka, dziedziny zastosowania oraz konkretnego algorytmu analizującego tekst. W niektórych przypadkach stop words mogą być jednak retainowane, jeśli mają one specyficzne znaczenie w danym kontekście.