De ce zigzaghează Gradient Descent și cum îl corectează Momentum
Gradient descent zigzaghează din cauza diferențelor mari de magnitudine ale gradientilor pe diferite direcții. Momentum, inspirat din fizică, netezește oscilațiile și accelerează convergența, fiind esențial în antrenarea rețelelor neuronale.
🕒 36 minute în urmă