如果單純把NN變得更deep,讓performance更好,這其實不意外,因為越deep的NN代表參數越多,structure越複雜。所以要跟shallow NN比較的話,要把shallow NN的neuron數拉到跟deep NN差不多才公平。
比較結果如上表,可以發現:
總結,多層比單層好,即便多層的neuron比單層還少。但為什麼?
其實我們在做DL,就是在做模組化(Modularization)這件事
Modularization:把一個大的function分為幾部分(sub function)