Brian Su says to YSITD
而為了解決平原的問題 才會有考慮動量的 optimizer