D0x0000FF@tg says to YSITD 所以你在optimization的時候,你會對weight跟bias做偏微然後利用資料來告訴你,那邊的connect應該要增強那邊應該要減弱,這樣才會更符合資料要的connection,然而你如果反而資料告訴你哪邊的connect不要增加那麼多,你卻在那個weight加了一個很大的數字