Definicja:
MLOps (skrót od Machine Learning Operations) to zestaw praktyk, procesów i narzędzi służących do zarządzania pełnym cyklem życia modeli uczenia maszynowego – od eksploracji danych, przez trenowanie modeli, aż po ich wdrażanie, monitorowanie i utrzymanie w środowisku produkcyjnym.

Tradycyjne podejście do ML:
Problemy:
Rozwiązanie: MLOps
ETAP 1
Zbieranie i eksploracja danych
Wyzwania:
MLOps: stosowanie narzędzi do data versioning (np. DVC), automatyczne pipeline’y przetwarzania danych.
ETAP 2
Przygotowanie danych (feature engineering)
MLOps: wykorzystanie feature store do przechowywania, wersjonowania i ponownego wykorzystania cech.
ETAP 3
Budowanie modelu (model development)
MLOps: śledzenie eksperymentów (np. MLflow), automatyzacja treningu, repozytorium modeli.
ETAP 4
Walidacja i testowanie modelu
MLOps: automatyczne testy metryk i jakości modelu (CI), walidacja przed wdrożeniem.
ETAP 5
Wdrożenie (deployment)
MLOps: CI/CD dla modeli – automatyzacja wdrażania (GitOps, ArgoCD, Kubeflow).
ETAP 6
Monitorowanie modelu
MLOps: monitorowanie metryk (np. Prometheus + Grafana, WhyLabs), alerty, retrenowanie.
ETAP 7
Aktualizacja i ponowne trenowanie (retraining)
MLOps: Continuous Training (CT), harmonogramy retreningu, testy A/B nowych wersji.
ETAP 7
Zarządzanie cyklem życia modeli
MLOps: Model Registry (MLflow, SageMaker Model Registry), kontrola wersji i uprawnień.
MLOps składa się z zestawu praktyk i narzędzi, które wspólnie tworzą kompletny, zautomatyzowany i skalowalny ekosystem dla modeli ML. Te komponenty pokrywają wszystkie etapy:
Kluczowe aspekty:
Narzędzia:
Kluczowe aspekty:
Narzędzia:
Kluczowe aspekty:
Narzędzia:
Kluczowe aspekty:
Narzędzia:
Kluczowe aspekty:
Narzędzia:

MLflow – zarządzanie eksperymentami i modelami
Co robi?
Zastosowanie: Śledzenie wyników eksperymentów; porównywanie modeli.
Alternatywy: Weights & Biases, Neptune.ai, Comet.ml
DVC (Data Version Control) – wersjonowanie danych i pipeline’ów
Co robi?
Zastosowanie: Reprodukowalność eksperymentów, kontrola wersji datasetów.
Alternatywy: Pachyderm, LakeFS, Delta Lake
Kubeflow / TFX / Metaflow – budowanie i zarządzanie pipeline’ami
Zastosowanie: Automatyzacja procesów przetwarzania danych, trenowania, testowania i deploymentu modeli.