96SEO 2026-02-20 08:27 0
由于原始的transformer模型不包含递归和卷积为了使模型利用序列的顺序原文在input

dmodel一样大所以两者可以相加。
加入位置编码的位置如下图所示
\sin\left(\frac{posk}{10000^{\frac{2i}{d}}}\right)
\sin\left(\frac{pos}{10000^{\frac{2i}{d}}}
\frac{k}{10000^{\frac{2i}{d}}}\right)
PE(posk,2i)sin(10000d2iposk)sin(10000d2ipos10000d2ik)
\cos\left(\frac{posk}{10000^{\frac{2i}{d}}}\right)
\cos\left(\frac{pos}{10000^{\frac{2i}{d}}}
\frac{k}{10000^{\frac{2i}{d}}}\right)
PE(posk,2i1)cos(10000d2iposk)cos(10000d2ipos10000d2ik)根据三角函数的和角公式
\sin\left(\frac{pos}{10000^{\frac{2i}{d}}}\right)
\cos\left(\frac{k}{10000^{\frac{2i}{d}}}\right)
\cos\left(\frac{pos}{10000^{\frac{2i}{d}}}\right)
\sin\left(\frac{k}{10000^{\frac{2i}{d}}}\right)
PE(posk,2i)sin(10000d2ipos)cos(10000d2ik)cos(10000d2ipos)sin(10000d2ik)
\cos\left(\frac{pos}{10000^{\frac{2i}{d}}}\right)
\cos\left(\frac{k}{10000^{\frac{2i}{d}}}\right)
\sin\left(\frac{pos}{10000^{\frac{2i}{d}}}\right)
\sin\left(\frac{k}{10000^{\frac{2i}{d}}}\right)
PE(posk,2i1)cos(10000d2ipos)cos(10000d2ik)−sin(10000d2ipos)sin(10000d2ik)线性函数的形式
\sin\left(\frac{k}{10000^{\frac{2i}{d}}}\right)
\cos\left(\frac{k}{10000^{\frac{2i}{d}}}\right)
\sin\left(\frac{k}{10000^{\frac{2i}{d}}}\right)
\cos\left(\frac{k}{10000^{\frac{2i}{d}}}\right)
Dot(PEpos,PEposk)i0∑d/2−1PE(pos,2i)⋅PE(posk,2i)PE(pos,2i1)⋅PE(posk,2i1)
\sin\left(\frac{pos}{10000^{\frac{2i}{d}}}\right)
\sin\left(\frac{posk}{10000^{\frac{2i}{d}}}\right)
\cos\left(\frac{pos}{10000^{\frac{2i}{d}}}\right)
\cos\left(\frac{posk}{10000^{\frac{2i}{d}}}\right)
Dot(PEpos,PEposk)i0∑d/2−1[sin(10000d2ipos)sin(10000d2iposk)cos(10000d2ipos)cos(10000d2iposk)]
sin(a)sin(b)cos(a)cos(b)cos(a−b)可得
\cos\left(\frac{posk}{10000^{\frac{2i}{d}}}
\frac{pos}{10000^{\frac{2i}{d}}}\right)
\cos\left(\frac{k}{10000^{\frac{2i}{d}}}\right)
Dot(PEpos,PEposk)i0∑d/2−1cos(10000d2iposk−10000d2ipos)i0∑d/2−1cos(10000d2ik)
最简单直观的加入位置信息的方式就是使用1234…直接对句子进行位置编码one-hot。
用二进制转化举个例子
上表中维度0维度1维度2维度3拼成的数字就是该位置对应的二进制表示。
可以看到每个维度每一列其实都是有周期的并且周期是不同的。
具体来说每个比特位的变化率都是不一样的越低位的变化越快越往右边走变化频率越快红色位置0和1每个数字会变化一次而黄色位每8个数字才会变化一次。
这样就能够说明使用多个周期不同的周期函数组成的多维度编码和递增序列编码其实是可以等价的。
这也回答了为什么周期函数能够引入位置信息。
同样的道理不同频率的sin正弦函数和cos余弦函数组合通过调整三角函数的频率可以实现这种低位到高位的变化这样就能把位置信息表示出来。
位置编码是固定的无法根据具体任务进行调整。
固定的位置编码对序列长度有限制。
在处理长序列时正弦和余弦函数的频率可能不足以捕捉所有的位置信息导致信息丢失。
位置编码在训练阶段是静态的。
这意味着在训练时确定的位置编码不适用于后续推理时的输入尤其是推理序列长度大于训练序列长度。
作为专业的SEO优化服务提供商,我们致力于通过科学、系统的搜索引擎优化策略,帮助企业在百度、Google等搜索引擎中获得更高的排名和流量。我们的服务涵盖网站结构优化、内容优化、技术SEO和链接建设等多个维度。
| 服务项目 | 基础套餐 | 标准套餐 | 高级定制 |
|---|---|---|---|
| 关键词优化数量 | 10-20个核心词 | 30-50个核心词+长尾词 | 80-150个全方位覆盖 |
| 内容优化 | 基础页面优化 | 全站内容优化+每月5篇原创 | 个性化内容策略+每月15篇原创 |
| 技术SEO | 基本技术检查 | 全面技术优化+移动适配 | 深度技术重构+性能优化 |
| 外链建设 | 每月5-10条 | 每月20-30条高质量外链 | 每月50+条多渠道外链 |
| 数据报告 | 月度基础报告 | 双周详细报告+分析 | 每周深度报告+策略调整 |
| 效果保障 | 3-6个月见效 | 2-4个月见效 | 1-3个月快速见效 |
我们的SEO优化服务遵循科学严谨的流程,确保每一步都基于数据分析和行业最佳实践:
全面检测网站技术问题、内容质量、竞争对手情况,制定个性化优化方案。
基于用户搜索意图和商业目标,制定全面的关键词矩阵和布局策略。
解决网站技术问题,优化网站结构,提升页面速度和移动端体验。
创作高质量原创内容,优化现有页面,建立内容更新机制。
获取高质量外部链接,建立品牌在线影响力,提升网站权威度。
持续监控排名、流量和转化数据,根据效果调整优化策略。
基于我们服务的客户数据统计,平均优化效果如下:
我们坚信,真正的SEO优化不仅仅是追求排名,而是通过提供优质内容、优化用户体验、建立网站权威,最终实现可持续的业务增长。我们的目标是与客户建立长期合作关系,共同成长。
Demand feedback