Allen Chou says to YSITD
你可以先把 ML 的 Gradient Descent 丟掉了,那個只是 GD 裡面很狹隘的一小部份 Newton's method 算是一個把 GD 公式化與系統化的方法之一