Tryb porównania
Dwie konfiguracje uczą się na tym samym zbiorze. Ustaw osobno architekturę, learning rate, aktywację i inicjalizację wag dla modelu A oraz B.
Konfiguracja A
Konfiguracja B
Granica decyzyjna i dane 2D
Tło pokazuje przewidywanie modelu, punkty są podzielone na train i validation.
train klasa 0
train klasa 1
validation klasa 0
validation klasa 1
granica progu decyzji
Tryb krokowy: forward -> loss -> backward -> update
Wybrana próbka przechodzi przez sieć. Wartości pokazują aktywacje, gradienty i zmianę wag.
Próbka
Wybrane wartości
Wpływ batch size i learning rate
Learning rate skaluje krok aktualizacji, a batch size wpływa na stabilność uśrednionego gradientu liczonego z próbek.
Metryki uczenia
Train loss, validation loss, train accuracy i validation accuracy pokazują jakość oraz uogólnianie modelu.