Data Lineage – śledzenie pochodzenia i historii transformacji danych.
Proces umożliwiający identyfikację źródeł danych oraz rejestrowanie ich pochodzenia, a także kolejnych etapów transformacji i przetwarzania. Dzięki niemu można odtworzyć ścieżkę, jaką przebyły dane od momentu ich pozyskania aż do aktualnej postaci. Jest to kluczowe narzędzie w zarządzaniu jakością danych, zapewnianiu ich integralności oraz transparentności procesów analitycznych i informatycznych.
W praktyce obejmuje monitorowanie i dokumentowanie zmian danych, operacji na nich wykonywanych, a także systemów i narzędzi zaangażowanych w ich przekształcanie. Wykorzystuje się go m.in. w Big Data, hurtowniach danych czy systemach analityki biznesowej, gdzie istotne jest zarówno śledzenie błędów, jak i audyt zgodności z wymogami regulacyjnymi. Pozwala to na bardziej efektywne zarządzanie danymi oraz wspiera podejmowanie decyzji opartych na rzetelnych i sprawdzonych informacjach.
W kontekście sztucznej inteligencji oraz uczenia maszynowego śledzenie pochodzenia danych umożliwia weryfikację wiarygodności modeli oraz transparentność ich działania, co jest ważne z punktu widzenia zaufania i interpretowalności algorytmów. Ułatwia także identyfikację potencjalnych źródeł błędów lub uprzedzeń w danych, co ma kluczowe znaczenie dla rozwoju i wdrażania etycznych rozwiązań w obszarze sztucznej inteligencji.