当前位置：首页 > SEO基础 >

如何组建一个莱州人社局网站需要多少人？

96SEO 2026-02-20 03:30 16

Bayesian

随机实验#xff0c;又称AB测试#xff0c;是行业中评估因果效应的既…

AB测试是用来评估变更效果的有效方法但很多时候会运行大量AB测试如果能够在测试中复用之前测试的结果将有效提升AB测试的效率和有效性。

原文:

Bayesian

随机实验又称AB测试是行业中评估因果效应的既定标准。

将新方法(新产品、功能、UI等)随机分配给人群中的特定子集(用户、患者、客户等)从而确保平均来说结果的差异(收入、访问量、点击量等)可以归因于不同的方法。

像Booking.com[2]这样的老牌公司报告说他们会同时运行数千个AB测试。

而多邻国(Duolingo)[3]等新兴公司的成功很大程度上要归功于他们的大规模实验文化。

在某个具体实验中能不能利用以前的测试信息如何利用在这篇文章中我们将尝试通过介绍AB测试的贝叶斯方法来回答这些问题。

贝叶斯框架很适合这种类型的任务允许使用新数据更新现有(先验)知识。

然而该方法对函数形式假设特别敏感模型选择(如先验分布的偏度)的微小区别可以造成非常不同的估算结果。

搜索和无限滚动

在本文其余部分我们将使用一个玩具示例该示例受到Azavedo等人(2019)[4]的启发:

搜索引擎希望在不牺牲搜索质量的情况下增加广告收入。

我们是一家拥有成熟实验文化的公司不断测试如何改进登录页面的新想法。

假设我们想出了一个绝妙的新想法:

无限滚动[5]如果用户想看到更多结果他们可以继续向下滚动而不是显示离散的页面序列。

我们将用户随机分为测试组和对照组只对测试组用户实施无限滚动。

我们从src.dgp[6]导入数据生成dgp_infinite_scroll()。

对于以前的文章我们生成了新的DGP父类处理随机化和数据生成其子类包含了具体用例。

我们还从src.utils[7]中导入了绘图函数和库。

为了不仅包含代码还包括数据和表格我们使用Deepnote[8]一个类似于Jupyter的网络协作笔记本环境。

from

dgp.generate_data(true_effect0.14)df.head()

past_revenueinfinite_scrollad_revenue03.7613.7012.4011.7122.9814.8534.2414.5743.8703.69

我们有1万名网站访问者信息观察他们每月产生的ad_revenue考虑是否被分配到测试组并使用infinite_scroll以及每月平均past_revenue。

随机测试分配使得均数差(difference-in-means)

估算器没有偏差[9]。

我们期望测试组和对照组平均来看具有可比性因此可以将观察到的平均结果差异归因于测试效果然后用线性回归估计测试效果从而可以将测试效果解释为infinite_scroll的作用。

smf.ols(ad_revenue

df).fit().summary().tables[1]看起来infinite_scroll确实是个好主意增加了0.1524美元的月平均收益。

此外在1%的置信水平下该效应显著高于零。

我们可以通过在回归中控制past_revenue来进一步提高估算器精度。

我们不期望估算系数有明显变化但精度应该会提高(如果想了解更多关于控制变量的信息请查看关于CUPED[10]和DAG[11]的其他文章)。

reg

df).fit()reg.summary().tables[1]

事实上past_revenue可以准确预测当前ad_revenue而infinite_scroll估算系数的精度降低了三分之一。

到目前为止一切都很正常。

然而正如开头所说假设这不是我们为改进浏览器(并最终提高广告收入)而进行的唯一实验无限滚动只是我们过去测试过的数千个想法中的一个有没有一种方法可以有效利用这些额外信息

贝叶斯统计

approach)的主要优势之一是可以比较容易的将额外信息合并到模型中该想法来源于贝叶斯统计背后的贝叶斯定理(Bayes

Theorem)[12]贝叶斯定理允许我们通过反转推理问题对模型进行推理:

从给定数据的模型的概率到给定模型的数据的概率从而使该对象更容易被处理。

贝叶斯定理

首先我们把贝叶斯定理映射到环境中明确数据是什么、模型是什么、我们感兴趣的对象是什么。

数据(data)

sm.add_constant(df[[past_revenue]].values)D

贝叶斯回归

线性系数β和τ以及残差方差σ。

等价但更符合贝叶斯模型的写法是:

条件分布y|x

其中半列将数据与模型参数分开。

与频率论方法不同在贝叶斯回归中不依赖中心极限定理[13]来近似y的条件分布而是直接假设它是正态分布。

我们感兴趣的是对模型参数β、τ和σ进行推理。

频率方法和贝叶斯方法的另一个核心区别是前者假设模型参数是固定、未知的而后者允许参数是随机变量。

可以很容易的以先验分布的形式合并关于模型参数的先验信息。

顾名思义先验包含了查看数据之前的可用信息。

这就引出了贝叶斯统计中最重要的一个相关问题:

如何选择先验信息

选择先验信息时一个有吸引力的限制是确定先验分布使得后验信息属于同一家族这叫做共轭先验(conjugate

priors)

。

例如在看到数据之前假设测试效果是正态分布的在结合数据中包含的信息后我们希望它也是正态分布的。

在贝叶斯线性回归的情况下β、τ和σ的共轭先验是正态分布和逆伽玛分布我们选择从标准正态和逆伽马分布开始。

先验分布

PyMC有一个非常好的函数model_to_graphviz允许我们将模型可视化为图形。

pm.model_to_graphviz(baseline_model)

模型图

现在准备计算模型的后验。

我们对模型参数的实现进行抽样计算给定值的数据的可能性并推导出相应的后验。

idata

贝叶斯推理需要抽样这在历史上一直是贝叶斯统计的主要瓶颈之一因为它比频率论方法要慢得多。

然而随着计算机模型计算能力的增强这已不再是问题。

现在准备检查结果。

首先使用summary()方法可以打印与用于线性回归的statmodels[15]包生成的模型摘要非常相似的模型摘要。

pm.summary(idata,

meansdhdi_2.5%hdi_97.5%mcse_meanmcse_sdess_bulkess_tailr_hatbeta[0]0.0190.025-0.0310.0680.0010.01943.01866.01.0beta[1]0.9920.0100.9701.0110.0000.02239.01721.01.0tau0.1570.0210.1170.1970.0000.02770.02248.01.0sigma0.9930.0070.9801.0070.0000.03473.02525.01.0

估算的参数与频率论方法得到的参数非常接近infinite_scroll的估算效果等于0.157。

如果取样的缺点是速度慢那么优点是非常透明可以直接画出后验的分布。

我们来计算一下测试效应τPyMC函数plot_posterior绘制后验分布黑色条表示贝叶斯等价的95%置信区间。

kindhist,

目前为止我们并没有对选择先验施加太多指导。

然而假设我们可以查阅过去的实验如何整合这些特定信息

假设无限滚动的想法只是我们过去尝试和测试过的众多想法中的一个对于每个想法都有相应的实验数据以及相应的估算系数。

past_experiments

我们从过去实验中得出了1000个估算值那如何使用这些额外的信息呢

常态先验

第一个想法可能是校准先验以反映过去的数据分布。

我们维持正态假设使用过去实验估算的平均值和标准差。

taus_mean

taus_mean计算结果为0.0009094486420266667意味着平均而言对ad_revenue几乎没有影响平均影响为0.0009。

taus_std

taus_std计算结果为0.029014447772168384意味着各实验之间存在明显的变化标准偏差为0.029。

with

pm.sample(modelmodel_normal_prior,

draws1000)

pm.plot_posterior(idata_normal_prior,

kindhist,

估算系数明显较小为0.11而不是先前估算的0.16。

为什么会这样呢

事实是考虑到我们的先验之前的系数0.16是极不可能的。

在给定先验条件下可以计算得到相同或更极端值的概率。

taus_std).cdf(0.16)

计算结果为2.0532795019789774e-08概率几乎为零。

因此估算系数已经向先前的平均值0.0009移动。

T先验(Student-t

目前为止我们假设所有线性系数都是正态分布。

这样合适吗让我们从截距系数(intercept

coefficient)

plt.subplots()sns.histplot([tau[1]

for

experiments);ax.axvline(reg.params[infinite_scroll],

lw2,

experiment)plt.legend();plt.title(rDistribution

$\hat{\tau}$

的分布在中心看起来像正态分布尾部更胖有两个非常极端的值。

排除测量误差这是行业中经常发生的情况大多数想法的影响都非常小或为零很少有想法是突破性的。

模拟这种分布的一种方法是T分布(student-t)[16]。

我们用均值为0.0009方差为0.003自由度为1.3的T分布来匹配过去估算的经验分布矩阵。

with

pm.sample(modelmodel_studentt_prior,

draws1000)

pm.plot_posterior(idata_studentt_priors,

kindhist,

估算系数类似于用标准先验得到的系数0.11然而由于置信区间从[0.077,0.016]缩小到[0.065,0.015]估算更加精确。

标准正态N(0,1)

enumerate(distributions.items()):

yy,

正如我们所看到的所有分布都以0为中心但形状非常不同。

标准正态分布在[-0.15,0.15]区间内基本上是平坦的每个值的概率基本相同。

而后两个尽管有相同的均值和方差但形态非常不同。

这如何转化为我们的估算对每个先验分布可以画出不同估算的隐含后验。

fig,

plt.subplots(figsize(7,6))ax.axvline(reg.params[infinite_scroll],

lw2,

enumerate(distributions.items()):

for

Estimate);ax.set_ylabel(Posterior);

正如我们所看到的不同的先验以非常不同的方式改变实验估算。

标准正态先验基本上对[-0.15,0.15]区间内的估算没有影响。

具有匹配矩阵的正常先验反而使每个估算值缩小约2/3。

T先验的影响是非线性的:

将小估算缩小到零而保持大估算不变。

灰色虚线标记了不同先验对实验估算τ的影响。

通过本文我们了解了如何扩展AB测试的分析以合并来自过去实验的信息。

我们特别介绍了AB测试的贝叶斯方法看到选择先验分布的重要性。

在相同均值和方差下假设存在肥尾(非常偏斜)的先验分布意味着小效应的收缩更强而大效应的收缩更少。

直觉上带有肥尾的先验分布相当于假设突破性想法是罕见的但不是不可能。

正如我们在这篇文章中所看到的这在实验后有实际意义但在实验前也有意义。

事实上正如Azevedo等人(2020)[17]所报告的那样如果你认为想法的效果分布比较正常那么最好是进行少量但大型的实验以便能够发现较小的效果。

相反如果你认为想法是要么是突破性的要么毫无意义即效果是肥尾的那么运行小而多的实验更有意义因为不需要大规模实验来检测大的效果。

本文所有代码都在Jupyter

https://github.com/matteocourthoud/Blog-Posts/blob/main/notebooks/bayes_ab.ipynb。

你好我是俞凡在Motorola做过研发现在在Mavenir做技术工作对通信、网络、后端架构、云原生、DevOps、CICD、区块链、AI等技术始终保持着浓厚的兴趣平时喜欢阅读、思考相信持续学习、终身成长欢迎一起交流学习。

微信公众号DeepNoMind

https://towardsdatascience.com/bayesian-ab-testing-ed45cc8c964d

[2]

https://partner.booking.com/en-gb/click-magazine/industry-perspectives/role-experimentation-bookingcom

[3]

https://blog.duolingo.com/improving-duolingo-one-experiment-at-a-time

[4]

https://www.aeaweb.org/articles?id10.1257/pandp.20191003

[5]

https://blog.google/products/search/continuous-scrolling-mobile

[6]

https://github.com/matteocourthoud/Blog-Posts/blob/main/notebooks/src/dgp.py

[7]

https://github.com/matteocourthoud/Blog-Posts/blob/main/notebooks/src/utils.py

[8]

https://en.wikipedia.org/wiki/Bias_of_an_estimator

[10]

https://towardsdatascience.com/understanding-cuped-a822523641af

[11]

https://towardsdatascience.com/controls-b63dc69e3d8c

[12]

https://en.wikipedia.org/wiki/Bayes_***orem

[13]

https://en.wikipedia.org/wiki/Central_limit_***orem

[14]

https://www.pymc.io/projects/docs/en/stable/learn.html

[15]

https://www.statsmodels.org/dev/index.html

[16]

https://en.wikipedia.org/wiki/Student%27s_t-distribution

[17]

https://www.journals.uchicago.edu/doi/full/10.1086/710607

END

标签： seo优化推广业务员招聘深圳罗湖医疗集团网站建设莱州人社局网站

上一篇：如何离线生成东方美学图片？
下一篇：如何高效利用DAMO-YOLO手机检测系统进行会议监控？

为您推荐

SEO优化服务概述

作为专业的SEO优化服务提供商，我们致力于通过科学、系统的搜索引擎优化策略，帮助企业在百度、Google等搜索引擎中获得更高的排名和流量。我们的服务涵盖网站结构优化、内容优化、技术SEO和链接建设等多个维度。

百度官方合作伙伴白帽SEO技术数据驱动优化效果长期稳定

SEO优化核心服务

网站技术SEO

网站结构优化 - 提升网站爬虫可访问性
页面速度优化 - 缩短加载时间，提高用户体验
移动端适配 - 确保移动设备友好性
HTTPS安全协议 - 提升网站安全性与信任度
结构化数据标记 - 增强搜索结果显示效果

内容优化服务

关键词研究与布局 - 精准定位目标关键词
高质量内容创作 - 原创、专业、有价值的内容
Meta标签优化 - 提升点击率和相关性
内容更新策略 - 保持网站内容新鲜度
多媒体内容优化 - 图片、视频SEO优化

外链建设策略

高质量外链获取 - 权威网站链接建设
品牌提及监控 - 追踪品牌在线曝光
行业目录提交 - 提升网站基础权威
社交媒体整合 - 增强内容传播力
链接质量分析 - 避免低质量链接风险

SEO服务方案对比

服务项目	基础套餐	标准套餐	高级定制
关键词优化数量	10-20个核心词	30-50个核心词+长尾词	80-150个全方位覆盖
内容优化	基础页面优化	全站内容优化+每月5篇原创	个性化内容策略+每月15篇原创
技术SEO	基本技术检查	全面技术优化+移动适配	深度技术重构+性能优化
外链建设	每月5-10条	每月20-30条高质量外链	每月50+条多渠道外链
数据报告	月度基础报告	双周详细报告+分析	每周深度报告+策略调整
效果保障	3-6个月见效	2-4个月见效	1-3个月快速见效

SEO优化实施流程

我们的SEO优化服务遵循科学严谨的流程，确保每一步都基于数据分析和行业最佳实践：

网站诊断分析

全面检测网站技术问题、内容质量、竞争对手情况，制定个性化优化方案。

关键词策略制定

基于用户搜索意图和商业目标，制定全面的关键词矩阵和布局策略。

技术优化实施

解决网站技术问题，优化网站结构，提升页面速度和移动端体验。

内容优化建设

创作高质量原创内容，优化现有页面，建立内容更新机制。

外链建设推广

获取高质量外部链接，建立品牌在线影响力，提升网站权威度。

数据监控调整

持续监控排名、流量和转化数据，根据效果调整优化策略。

SEO优化常见问题

SEO优化一般需要多长时间才能看到效果？

SEO是一个渐进的过程，通常需要3-6个月才能看到明显效果。具体时间取决于网站现状、竞争程度和优化强度。我们的标准套餐一般在2-4个月内开始显现效果，高级定制方案可能在1-3个月内就能看到初步成果。

你们使用白帽SEO技术还是黑帽技术？

我们始终坚持使用白帽SEO技术，遵循搜索引擎的官方指南。我们的优化策略注重长期效果和可持续性，绝不使用任何可能导致网站被惩罚的违规手段。作为百度官方合作伙伴，我们承诺提供安全、合规的SEO服务。

SEO优化后效果能持续多久？

通过我们的白帽SEO策略获得的排名和流量具有长期稳定性。一旦网站达到理想排名，只需适当的维护和更新，效果可以持续数年。我们提供优化后维护服务，确保您的网站长期保持竞争优势。

你们提供SEO优化效果保障吗？

我们提供基于数据的SEO效果承诺。根据服务套餐不同，我们承诺在约定时间内将核心关键词优化到指定排名位置，或实现约定的自然流量增长目标。所有承诺都会在服务合同中明确约定，并提供详细的KPI衡量标准。

SEO优化效果数据

基于我们服务的客户数据统计，平均优化效果如下：

+85%

自然搜索流量提升

+120%

关键词排名数量

+60%

网站转化率提升

3-6月

平均见效周期

行业案例 - 制造业

优化前：日均自然流量120，核心词无排名
优化6个月后：日均自然流量950，15个核心词首页排名
效果提升：流量增长692%，询盘量增加320%

行业案例 - 电商

优化前：月均自然订单50单，转化率1.2%
优化4个月后：月均自然订单210单，转化率2.8%
效果提升：订单增长320%，转化率提升133%

行业案例 - 教育

优化前：月均咨询量35个，主要依赖付费广告
优化5个月后：月均咨询量180个，自然流量占比65%
效果提升：咨询量增长414%，营销成本降低57%

为什么选择我们的SEO服务

专业团队

10年以上SEO经验专家带队
百度、Google认证工程师
内容创作、技术开发、数据分析多领域团队
持续培训保持技术领先

数据驱动

自主研发SEO分析工具
实时排名监控系统
竞争对手深度分析
效果可视化报告

透明合作

清晰的服务内容和价格
定期进展汇报和沟通
效果数据实时可查
灵活的合同条款

我们的SEO服务理念

我们坚信，真正的SEO优化不仅仅是追求排名，而是通过提供优质内容、优化用户体验、建立网站权威，最终实现可持续的业务增长。我们的目标是与客户建立长期合作关系，共同成长。