ETL/ELT – procesy przygotowania danych do analizy.
ETL i ELT to kluczowe procesy w obszarze przygotowania danych do analizy, mające na celu efektywne przeniesienie, transformację oraz załadowanie danych z różnych źródeł do systemów analitycznych lub magazynów danych. ETL (Extract, Transform, Load) polega na najpierw wyodrębnieniu danych, następnie ich przetworzeniu i dostosowaniu do pożądanego formatu albo struktury oraz dopiero potem załadowaniu do docelowego systemu. Ten model jest często stosowany tam, gdzie transformacje są skomplikowane i wymagają dużych zasobów obliczeniowych poza systemem docelowym.
ELT (Extract, Load, Transform) różni się od ETL kolejnością wykonywanych operacji – w tym podejściu dane są najpierw wyodrębniane i ładowane bezpośrednio do systemu analitycznego lub hurtowni, a następnie przetwarzane na miejscu. Takie rozwiązanie korzysta z mocy obliczeniowej nowoczesnych baz danych i systemów przetwarzania równoległego, co pozwala na bardziej elastyczne i szybkie operacje transformacji zwłaszcza przy dużych wolumenach danych. Oba procesy stanowią fundamentalny etap integracji danych, umożliwiając ich przygotowanie do dalszej analizy, raportowania czy wykorzystania w systemach uczenia maszynowego.