Named Entity Recognition (NER) – wyodrębnianie nazw własnych z tekstu.

Jest to technika przetwarzania języka naturalnego służąca do automatycznej identyfikacji i klasyfikacji nazw własnych w tekście. Do nazw własnych zalicza się m.in. imiona i nazwiska osób, nazwy miejscowości, organizacji, daty, wartości liczbowe czy inne wyróżnione jednostki semantyczne. Proces ten umożliwia wydobycie z nieustrukturyzowanego tekstu elementów o określonym znaczeniu, które mogą być dalej analizowane lub wykorzystywane w różnych aplikacjach.

Metody wykorzystywane do wyodrębniania nazw własnych opierają się zarówno na regułach językowych, jak i na technikach uczenia maszynowego, w tym na modelach opartych na sieciach neuronowych. Systemy NER często integrują informacje kontekstowe oraz dane leksykalne, co pozwala na zwiększenie dokładności rozpoznawania. Zastosowania tej technologii można znaleźć m.in. w systemach wyszukiwania informacji, analizie dokumentów, automatycznym generowaniu streszczeń czy w systemach dialogowych.