DVC (Data Version Control) – narzędzie do wersjonowania dużych zbiorów danych.

DVC jest narzędziem służącym do wersjonowania dużych zbiorów danych oraz modeli w projektach związanych z uczeniem maszynowym i analizą danych. Pozwala na śledzenie zmian w danych w sposób analogiczny do systemów kontroli wersji kodu źródłowego, takich jak Git, ale przystosowany do zarządzania plikami o znacznych rozmiarach, które często występują w procesach trenowania modeli AI. Dzięki temu umożliwia zachowanie spójności i powtarzalności eksperymentów, a także ułatwia współpracę zespołową.

Narzędzie integruje się bezpośrednio z istniejącymi repozytoriami kodu, oddzielając przechowywane dane od samego kodu źródłowego, a jednocześnie umożliwiając ich synchronizację. Użytkownicy mogą łatwo przełączać się między różnymi wersjami danych i modeli, co wspiera kontrolę nad przebiegiem eksperymentów oraz prowadzenie ich dokumentacji. DVC jest wykorzystywane głównie w środowiskach badawczych i praktycznych zastosowaniach sztucznej inteligencji, gdzie zarządzanie dużymi i zmiennymi zbiorami danych jest kluczowe dla efektywności i powtarzalności pracy.