Small Language Models (SLM) – trend tworzenia modeli o mocy GPT-3.5, ale mieszczących się w telefonie.

Termin odnosi się do nowego nurtu w rozwoju sztucznej inteligencji polegającego na tworzeniu zaawansowanych modeli językowych o mocy porównywalnej do dużych systemów, takich jak GPT-3.5, lecz wystarczająco lekkich, aby mogły być uruchamiane bezpośrednio na urządzeniach mobilnych, np. smartfonach. Takie podejście umożliwia korzystanie z zaawansowanych możliwości przetwarzania języka naturalnego bez konieczności stałego połączenia z chmurą obliczeniową, dzięki czemu poprawia się prywatność, szybkość działania oraz dostępność narzędzi AI.

Osiągnięcie tego celu jest możliwe dzięki postępom w optymalizacji architektur modeli, kompresji parametrów oraz efektywnemu wykorzystaniu zasobów sprzętowych współczesnych telefonów. Modele te są projektowane tak, aby zachować wysoką jakość generowanych odpowiedzi i zrozumienie kontekstu tekstowego, jednocześnie znacznie zmniejszając zapotrzebowanie na pamięć oraz moc obliczeniową. Trend ten odpowiada na rosnące zapotrzebowanie na inteligentne aplikacje mobilne oraz dążenie do decentralizacji usług AI, oferując użytkownikom swobodę korzystania z zaawansowanych technologii w wygodny i bardziej prywatny sposób.