96SEO 2026-02-20 01:21 14
我相信大家尤其是新手入门都看过不少“5min入门CNN”、“一张图搞定CNN”…等等之类的文章虽然这种文章确实能够帮助我们快速理解CNN的特点但是这种“过于轻松”的方式也可能会让我们丢掉许多卷积神经网络实现的细节问题很难对CNN有更加深入的理解。

first”的人写这篇文章的目的就在于帮助大家怎样用公式表达/推导这样一种更加严谨老派的方式解释CNN训练过程目的就在于1通过这种“辛苦”的脑力劳动帮助大家更加深刻具体的理解数据、结构、参数、损失、函数训练这些要素怎样在一起工作运转起来的2而来也是为了帮助大家以后能够更好地阅读前沿文献不至于看到公式就皱眉头。
好了接下来就让我们一起愉快地学习吧
z_j^{l}\sum_{i1}^{M}a_{i}^{l-1}
j}^{l}b_j^{l},a_j^{l}\sigma\left(z_j^{l}\right)
zjli1∑Mail−1∗wijlbjl,ajlσ(zjl)
M⋅N;在结构确定的情况下反向传播算法需要更新的就是卷积核的值和偏置;
池化操作并改变输出节点或者说特征图个数即输入多少张特征图经池化后输出多少张特征图
j}^{l}b_j^{l},a_j^{l}\sigma\left(z_j^{l}\right)
zjli1∑Mail−1∗wijlbjl,ajlσ(zjl)
全连接层的公式基本和卷积层一样因为形式上可以把全连接层看成一种卷积核尺寸和输入节点或者特征图尺寸一样的卷积
在结构确定的情况下反向传播算法需要更新的就是卷积核的值和偏置。
\{x^0,y^0\},\{x^1,y^1\},...,\{x^P,y^P\}
aL我们处理的是一个多元分类问题比如说判断一张图片中的数字是0~9中哪一个数字那么任意一组训练输出节点就是一个
\sum_{k1}^10\left({x_k-y_k}\right)^2
J21∣∣aL−y∣∣2k1∑10(xk−yk)2而总的误差也就应为
J表示总的误差当然了物产函数有很多种大家根据需要灵活挑选就行啦至此数据变经过层层处理最总形成了我们的目标函数
因为我们构造神经网络的目的就是为了找到一种网络结构能够在给定输入的情况下能够让输出和目标想匹配也就是说让
(W,b)argmin(J(w,b,x,y))这里就需要引入梯度下降法来不断更新卷积核权值和偏置
(W,b)n1(W,b)n−r⋅grad(J(W,b)n)这里r就是学习速率的意思通过不断调整权重和偏置的权值从而使得
既然我们要求误差对(W,b)的偏导值那么我们首先要明确一下几点内容
我们要首先明白在整个神经网络结构确定的情况下我们需要动态调整的参数主要有:1)卷积层的权重w和偏置2)因为池化层只有一个反向池化操作不存在偏置和激活函数的问题所以我们基本可以说不存在调整参数的问题3)因为从形式上看全连接层可以看成一种特俗结构的卷积神经网络(即卷积核大小和输入的特征节点或者特征图尺寸相同)所以即使假设存在多层的全连接层具体的处理过程参照卷积层推导即可为了确定
∂W∂J(W,b),∂b∂J(W,b),我们需要引入一个间接量
那么我们基本就可以明白接下来的任务就主要分为三类1)已知池化层
因为池化层不存在激活函数这一说而常见的池化操作有两种maxpooling和average
⎝⎜⎜⎛0.50.5110.50.511221.51.5221.51.5⎠⎟⎟⎞,如果池化操作为max
δil−1∂zl−1∂J(W,b)δjl(∂zil−1∂zjl)δjl∗rot180(Wijl)⊙σ′(zil−1)这一步的推导很难也很抽象尤其是像
rot180这种操作不过大家不要慌怎么推导的我会给大家解释的清清楚楚在次之前首先要明确几点概念和问题
⊙代表的是矩阵的点积的意思接下来的描述很重要很重要很重要希望大家认真品一品我们的任务是什么就是已知误差函数J对卷积层输出z的偏导(或者说J对卷积层输出矩阵
z,zl−1是矩阵标量对矩阵求偏导很好表示无非就是标量对矩阵每一个元素求导那矩阵对矩阵求导呢就比如上式中
∂zil−1∂zjl是一个矩阵对矩阵求导的过程该怎么处理呢答案是
∂zil−1∂zjl只是一个表示方法严格来讲这种写法是不准确的并不能直接用来使用推导公式那上面公式最右端的式子是怎么推导出来的在上式中注意
好的接下来我会慢慢分析来帮助大家理解上面内容或问题首先先回顾一下链式求导法则对于函数
h(x)f(g(x))则h′(x)f′(g(x))g′(x)那么假设第
\end{array}\right)\left(\begin{array}{ll}
\end{array}\right)\left(\begin{array}{cc}
⎝⎛a11a21a31a12a22a32a13a23a33⎠⎞∗(W11W21W12W22)(b11b21b12b22)(Z11221Z12Z22)而且
z11a11w11a12w12a21w21a22w22b11
z12a12w11a13w12a22w21a23w22b12
z21a21w11a22w12a31w21a32w22b21
z22a22w11a23w12a32w21a33w22b22那我们现在已经都知道
∂z11l∂J,∂z12l∂J,∂z21l∂J,∂z22l∂J也已知那要求
∂a11l∂J,∂a12l∂J,∂a13l∂J.....,那根据链式求导法则就需要看
z11,z12,z21...之间的关系了首先根据上面的一列式子我们发现和
∂a111−1∂J(w,b)∂z112∂J(w,b)w11δ11w11∂a12∂J(w,b)∂z11∂J(w,b)w12∂z12∂J(w,b)w11δ11w12δ12w11∂a13∂J(W,b)∂z12∂J(w,b)w12δ12w12∂a21∂J(W,b)∂z11∂J(w⋅b)w21dz21∂J(w1b)w11δ11w21δ21w11da22∂J(w,b)∂z11∂J(w,b)w22∂z12∂J(w,b)w21∂z21∂J(w,b)w12∂z22∂J(w,b)w11∂a23∂J(w,b)∂z12∂J(w,b)w22∂z22∂J(w,b)w12δ12w22δ22w12∂a31∂J(w,b)∂z21∂J(w,b)w21δ21w21∂a32∂J(w1b)∂z21∂J(w,b)w22∂z22∂J(w,b)W21δ21w22δ22w21∂a33∂J(w,b)∂z22∂J(w,b)W22δ22⋅w22
\end{array}\right)\left(\begin{array}{cccc}
⎝⎛∂a11∂J∂a21∂J∂a31∂J∂a12∂J∂a22∂J∂a32∂J∂a13∂J∂a23∂J∂a33∂J⎠⎞⎝⎜⎜⎛00000δ11δ2100δ12δ2200000⎠⎟⎟⎞∗(w22w12w21w11)这也就解释了卷积核反转180的原因除此之外对于任意的
∂ail−1∂J(W,b)∂zjl∂J(W,b)∗rot180(Wijl)进一步推导
∂zil−1∂J(W,b)∂ail−1∂J(W,b)⊙σ′(zil−1)∂zjl∂J(W,b)∗rot180(Wijl)⊙σ′(zil−1)
因为池化层并不存在参数问题而形式上全连接层可以理解成一种结构较为特殊的卷积层或者参照深度神经网络反向传播算法的推导过程DNN反向传播算法所以我们比较关系但也是最重要的参数求导过程就是卷积层权重和偏置的求导过程。
推导公式如下
\sum\limits_{u,v}(\delta^l)_{u,v}
∂bl∂J(W,b)u,v∑(δl)u,v同样参照链式求导法则假设第
\end{array}\right)\left(\begin{array}{ll}
\end{array}\right)\left(\begin{array}{cc}
⎝⎛a11a21a31a12a22a32a13a23a33⎠⎞∗(W11W21W12W22)(b11b21b12b22)(Z11221Z12Z22)
z11a11w11a12w12a21w21a22w22b11
z12a12w11a13w12a22w21a23w22b12
z21a21w11a22w12a31w21a32w22b21
z22a22w11a23w12a32w21a33w22b22
∂W11∂J(W,b)∂z11∂J(W,b)⋅∂W11∂z11∂z12∂J(W,b)⋅∂W11∂z12∂z21∂J(W,b)⋅∂W11∂z21∂z22∂J(W,b)⋅∂W11∂z22
a11δ11a12δ12a21δ21a22δ22同理可得
∂W12l∂J(W,b)a12δ11a13δ12a22δ21a23δ22∂W13l∂J(W,b)a13δ11a14δ12a23δ21a24δ22∂W21l∂J(W,b)a21δ11a22δ12a31δ21a32δ22,进一步整理
∂Wl∂J(W,b)⎝⎜⎜⎛a11a21a31a41a12a22a32a42a13a23a33a43a14a24a34a44⎠⎟⎟⎞∗(δ11δ21δ12δ22)al−1∗δl
∂bl∂J(W,b)δl至此有关反向传播的所有环节就已经结束了。
在整个神经网络架构已经清晰明确且训练数据确定的情况下我们就可以编写代码来训练我们的神经网络了步骤如下
(W,b)i1(W,b)i−r⋅∂(W,b)∂J返回至步骤2直至损失函数小于我们的预设值
作为专业的SEO优化服务提供商,我们致力于通过科学、系统的搜索引擎优化策略,帮助企业在百度、Google等搜索引擎中获得更高的排名和流量。我们的服务涵盖网站结构优化、内容优化、技术SEO和链接建设等多个维度。
| 服务项目 | 基础套餐 | 标准套餐 | 高级定制 |
|---|---|---|---|
| 关键词优化数量 | 10-20个核心词 | 30-50个核心词+长尾词 | 80-150个全方位覆盖 |
| 内容优化 | 基础页面优化 | 全站内容优化+每月5篇原创 | 个性化内容策略+每月15篇原创 |
| 技术SEO | 基本技术检查 | 全面技术优化+移动适配 | 深度技术重构+性能优化 |
| 外链建设 | 每月5-10条 | 每月20-30条高质量外链 | 每月50+条多渠道外链 |
| 数据报告 | 月度基础报告 | 双周详细报告+分析 | 每周深度报告+策略调整 |
| 效果保障 | 3-6个月见效 | 2-4个月见效 | 1-3个月快速见效 |
我们的SEO优化服务遵循科学严谨的流程,确保每一步都基于数据分析和行业最佳实践:
全面检测网站技术问题、内容质量、竞争对手情况,制定个性化优化方案。
基于用户搜索意图和商业目标,制定全面的关键词矩阵和布局策略。
解决网站技术问题,优化网站结构,提升页面速度和移动端体验。
创作高质量原创内容,优化现有页面,建立内容更新机制。
获取高质量外部链接,建立品牌在线影响力,提升网站权威度。
持续监控排名、流量和转化数据,根据效果调整优化策略。
基于我们服务的客户数据统计,平均优化效果如下:
我们坚信,真正的SEO优化不仅仅是追求排名,而是通过提供优质内容、优化用户体验、建立网站权威,最终实现可持续的业务增长。我们的目标是与客户建立长期合作关系,共同成长。
Demand feedback