Lematyzacja – sprowadzanie słowa do jego formy podstawowej.
Proces polegający na sprowadzaniu formy odmienionej słowa do jego podstawowej, najbardziej ogólnej postaci, zwanej lematem. Celem jest ujednolicenie różnych form fleksyjnych wyrazu, co ułatwia jego przetwarzanie i analizę w systemach opartych na przetwarzaniu języka naturalnego. W przeciwieństwie do stemmingu, który obcina końcówki w sposób często mechaniczny i uproszczony, lematyzacja uwzględnia analizę morfologiczno-syntaktyczną oraz kontekstową, co pozwala na precyzyjniejsze rozpoznanie formy podstawowej.
Wykorzystuje się ją powszechnie w systemach wyszukiwania informacji, analizie tekstu, tłumaczeniach maszynowych oraz innych zastosowaniach sztucznej inteligencji związanych z językiem. Efektywna lematyzacja wymaga zazwyczaj zastosowania słowników językowych oraz reguł gramatycznych, dzięki którym możliwe jest właściwe rozpoznanie kategorii gramatycznej i formy wyjściowej słowa.