暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

多层神经网络原理推导

山人彤 2020-12-07
630

1 结构

第0层是输入层,输入为X,维度为,其中表示第0层含有的节点,也是X的特征数。表示样本数。

以此类推,第1层的节点数,第2层的节点数,...,第L层的节点数

2 正向过程

第0层输入层数据,维度表示第0层含有的节点,也是X的特征数。表示样本数。

第1层:表示第1层权值,维度表示第1层偏置,维度,这里的加号“+”,使用了广播方式,会将按列复制成维度,从而与前面的相加。是第1层线性处理后的值,维度表示第1层的激活函数,表示第1层的输出,维度

第2层:表示第2层权值,维度表示第2层偏置,维度是第2层线性处理后的值,维度表示第2层的激活函数,表示第2层的输出,维度

第L层:表示第L层权值,维度表示第L层偏置,维度是第L层线性处理后的值,维度表示第L层的激活函数,表示第L层的输出,维度就是网络的输出。

写在一起就是:

3 loss

损失函数可以有很多,如交叉熵,MSE等等

4 反向传播

后续的,以此类推即可完成所有层的反向传播。


文章转载自山人彤,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论