Allen Chou says to YSITD
koru 概念中的 gradient descent 比較像是 optimization algorithm 的 gradient descent,但他本身其實以很多不同的形式出現在不同的問題中(例如 Newton method 是可以趨近 optimal solution 的),所以我才會說先把他在 ML 學到的東西暫時放一旁