1 结构

第0层是输入层,输入为X,维度为,其中表示第0层含有的节点,也是X的特征数。表示样本数。
以此类推,第1层的节点数,第2层的节点数,...,第L层的节点数。
2 正向过程
第0层输入层数据,维度。表示第0层含有的节点,也是X的特征数。表示样本数。
第1层:,。表示第1层权值,维度。表示第1层偏置,维度,这里的加号“+”,使用了广播方式,会将按列复制成维度,从而与前面的相加。是第1层线性处理后的值,维度。表示第1层的激活函数,表示第1层的输出,维度
第2层:,。表示第2层权值,维度。表示第2层偏置,维度。是第2层线性处理后的值,维度。表示第2层的激活函数,表示第2层的输出,维度
第L层:,。表示第L层权值,维度。表示第L层偏置,维度。是第L层线性处理后的值,维度。表示第L层的激活函数,表示第L层的输出,维度。就是网络的输出。
写在一起就是:
3 loss
损失函数可以有很多,如交叉熵,MSE等等
4 反向传播
后续的,以此类推即可完成所有层的反向传播。
文章转载自山人彤,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




