Instruction Tuning – douczanie modelu, aby lepiej wykonywał konkretne polecenia.
Jest to proces polegający na dodatkowym trenowaniu modelu językowego z wykorzystaniem specjalnie przygotowanych zestawów danych zawierających instrukcje lub polecenia oraz odpowiadające im oczekiwane odpowiedzi. Celem takiego douczania jest zwiększenie zdolności modelu do rozumienia i precyzyjnego wykonywania konkretnych poleceń, co przekłada się na bardziej trafne i adekwatne rezultaty w interakcji z użytkownikiem. Metoda ta pozwala na dostosowanie ogólnego modelu do specyficznych zadań lub zastosowań, poprawiając w ten sposób jego użyteczność.
W procesie tym model uczy się powiązań między różnorodnymi instrukcjami a ich wykonaniem, co umożliwia lepsze rozumienie intencji stojących za poleceniami oraz elastyczne reagowanie na nowe, wcześniej nieznane warianty zapytań. Dzięki temu można uzyskać bardziej naturalne i kontekstowo właściwe odpowiedzi. Instruction tuning jest szczególnie istotny w kontekście rozwijania asystentów głosowych, chatbotów czy systemów dialogowych, gdzie precyzja i adekwatność reakcji mają kluczowe znaczenie dla satysfakcji użytkowników.