Li-Fan Chen says to YSITD
我說梯度下降其實是用啟發法想到的