本文重点
前面我们学习了单样本的前向传播,本文我们学习多样本的前向传播,我们先来回忆一下,神经网络的单样本的前向传播的向量化的方式:
m个样本依次进行前向传播
这里我们说明一下符号:
我们使用(m)表示第m个样本,用[m]表示神经网络的第m层
a[2](i) 表示第i个样本计算前向传播时第二个隐藏层的a向量(因为没下标所有表示第二个隐藏层所有神经元的a值构成的列向量)
如果我们要不使用多样本向量化的方式,每一个样本都要依次执行一次前面的前向传播,也就每个样本都要经历x->z->a的过程,那么m个样本就需要执行m次。这里是一个样本接着一个样本进行向量化处理的,用伪代码表示就是
现在我们已经知道了m个样本是如何计算前向传播的,总结一句话就是每个样本依次进行前向传播,m个样本要走m次神经网络进行m次前向传播产生m个输出y(m),这是依次进行单样本向量化,所以效率很低,我们可以使用多样本地向量化来解决这个问题。
m样本应该向量化计算
我们将样本组成一个样本矩阵,每一列是一个样本,然后我们的参数矩阵W如下所示: