当前位置：首页 > SEO教程 >

如何为我的公司定制一个具有网站轮播图片特效的门户型网站建设？

96SEO 2026-02-20 02:50 17

习比较

监督学习是需要给定X、YX为特征Y为标签选择模型学习目标函数最优化问题生成模型这个模型本质上是一组参数

无监督机器学习的数据只有X没有标签只根据X的相似度来做一些事情相似度的计算一般通过距离来度量。

相似度高的聚类在一起进而可以对数据降维

聚类算法

划分聚类是一系列扁平的结构它们之间没有任何显式的结构来表名彼此的关联性。

常见算法有K-means、K-medoids、Gaussian

Mixture

Clustering等层次聚类是具有层次结构的簇集合因此能够输出比划分聚类输出的无结构簇集合提供更丰富的信息。

层次聚类可以认为是嵌套的划分聚类常见算法有Single-linkage、Complete-linkage、Connectivity-based

Clustering等

d(X,Y)\sqrt[p]{(x_1-y_1)^p(x_2-y_2)^p(x_3-y_3)^p...(x_p-y_p)^p}

d(X,Y)p(x1−y1)p(x2−y2)p(x3−y3)p...(xp−yp)p

p1时曼哈顿距离p2时欧氏距离p无穷切比雪夫距离哪个纬度值最大就是哪个差值作为距离

余弦距离

cos\***ta\frac{x_1x_2y_1y_2}{\sqrt{x_1^2y_1^2}\times

\sqrt{x_2^2y_2^2}}

从图中很容易看出a/b/c之间的关系将a2b2-c^2作为一个判定因子Δ则Δ是abc三个变量的函数。

对于同样一个角如果三角形边长过长则Δ会变动很大如果过小则Δ会变动很小也就是说没有归一化。

为了消除边长的影响需要除以2ab保证Δ的范围在-1到1之间

根据三角形的公理两边之和大于第三边两边之差小于第三边得出abca-b那么c2的取值范围为(ab)2c2(a-b)2展开就是a2b22abc2a2b^2-

2ab于是判定因子Δa2b2-c^2的范围在-2ab到2ab之间这样就把Δ规范到了-1到1之间

cosθ(a2b2-c^2)/2ab

将文章分词将文章转变为词向量TFIDF逆文档频率如果将文章分词通过one-hot编码会产生稀疏的问题而TFIDF很好的解决了这个问题转换为词向量后将文章映射到高维空间变为一个向量文章之间的向量的余弦距离代表文章之间的相似度

4.1

是inverse的意思代表某词在语料库中的重要程度为了减少经常用的词对于相似度的贡献比如“的”“是”这一类的词

TF-IDF:

主要用于计算符号度量或布尔值度量的个体间的相似度个体的特征属性由符号度量或者布尔值表示无法衡量差异具体值的大小只能获得“是否相同”这个结果所以Jaccard系数只判断个体间共同具有的特征是否一致的问题

用于网页去重、文本相似度分析

理解pearson相关系数首先要理解协方差Covariance协方差是反映两个随机变量相关程度的指标如果一个变量跟随另一个变量同时变大或者变小那么这两个变量的协方差就是正值反之相反公式

pearson公式

1与样本数量有关如果n过小很有可能出现接近1n过大可能小于1且显著性检测时采用t检验要求数据来自正态分布样本过小可能导致要求不满足

2从含义上看如果出现X11,

pearson相关系数实际上是做了标准化的cospearson是余弦相似度在维度缺失情况下的一种改进如何理解皮尔逊相关系数Pearson

Correlation

先给定K个划分迭代样本与簇的隶属关系每次都比之前一次好一些迭代若干次后就能得到比较好的结果

5.2

初始化选择K个初始的簇中心怎么选分配逐个计算每个样本到中心的距离将样本归属到距离最小的那个簇中心的簇中更新每个簇内部计算平均值更新簇中心迭代重复步骤2和步骤3知道满足停止条件比如集群中心不再显著变化或者达到设定的迭代次数

5.3

对异常值敏感计算距离时我们使用L2距离的平方。

这样对离群点很敏感会把中心点拉偏对初始值敏感对某些分布聚类效果不好

5.4

计算新的簇中心的时候不再选择均值而是选择中位数抗噪能力得到加强为避免平方计算对离群点的敏感把平方变成绝对值限制聚类中心点必须来自数据点

求中心点的计算方法由原来的直接计算重心变成计算完重心后在重心附近找一个数据点作为新的中心点K-medoids重拟合步骤直接求平均的K-means要复杂一些

二分K-means

每个点到中心点位置的MSE分别计算四个簇的MSE会发现有两个簇的MSE很小一个簇的MSE很大选择合并簇中心点比较近MSE很小的簇切分簇中心离其他簇中心比较远MSE比较大的簇重新进行K-means聚类

K-means

现在目前的模型基本使用的是K-meansK-means改变初始中心点的位置

2计算每个样本到第一个中心点的距离3将距离转化为概率4概率化选择

5.5

K-means的理论基础是假设各簇之间符合同方差的高斯分布模型

通过最大似然估计得到K-means的迭代方法这个函数是个非凸函数根据初始值不同只能得到局部最优解

5.6

K值的选择是执行K均值聚类时需要仔细考虑的问题选择的不合适可能导致聚类结果不准确或不具有实际意义

5.6.1

轮廓系数结合了聚类的凝聚度Cohesion和分离度Separation用于评估聚类的结果

簇内距离同一簇内其他点到某个点的距离的平局值簇间距离某个点到其他簇每个点的平均值

最终目的是为了使簇内部距离最小化簇间距离最大化。

所以SC越靠近1说明b越大于a即外部距离大内部距离小说明分类效果越好

然而当我们根据不同的K计算出几个SC值差不多时并不是盲目选更大的SC如下面的例子

n_clusters

每次聚类后每个样本得到一个轮廓系数当SC1时说明这个点与周围簇距离较远结果非常好当SC0时说明这个点可能处在两个簇的边界上当值为负时该点可能被误分

从上面结果来说K取2和4其实都不错但可以从下图看出K取2的话第0簇的宽度远宽于第1簇也就是说黑色数量比绿色多太多而K取4的话每个簇其差别不大。

所以选K4更好

5.6.3

例如数据-0.2、0.4、-0.8、1.3、-0.7为真实值和误差值的差

SSE是松散度的衡量所以SSE越小越好。

随着聚类迭代其值越来越小知道最后区域稳定

5.6.4

CH系数类别内部数据的协方差越小越好类别之间的协方差越大越好这样的Calinski-Harabasz分数s会高分数s高则聚类效果好。

**换句话说类别内部数据的距离平方和越小越好类别之间的距离平方和越大越好**

其中tr为矩阵的迹Bk是类别之间的协方差矩阵Wk是类别内部数据的协方差矩阵m是训练集样本数量k是类别数量

5.6.5

SSE误差平方和越小越好肘部法下降突然变缓时即认为是最佳K值SC系数取值为[-1,

1]其值越大越好CH系数分数S高则聚类效果越好CH需要达到的目的用尽量少的类别聚类尽量多的样本同时获取较好的聚类效果

Canopy聚类

Canopy聚类只进行一次划分聚类是基于距离阈值进行的快速聚类算法而这些阈值通常需要进行调整以得到满意的聚类结果。

实际应用中适合K-means聚类结合使用一般是先用Canopy聚类将K值计算出来然后用K-means进行迭代

Canopy聚类步骤

随机产生d属于D作为中心点计算所有点到d的距离所有距离t1的点归属于d的中心点从D中删除d及距离小于t2的点

聚类效果

Clustering是聚类算法的一种通过计算不同类别的数据点间的相似度来创建一颗有层次的嵌套聚类树在聚类树中不同类别的原始数据点是树的最低层树的顶层是一个聚类的根节点创建聚类树有自上而下和自下而上分列两种方法。

7.1

最开始假设每个样本点是一个簇计算每个样本间的相似度也就是距离得到一个相似矩阵寻找各个类之间的最近的两个类即若B、C的相似度最高合并簇B和C现在变为A,BC,D,E,F更新簇类间的相似矩阵若BC和D相似度最高归为一个簇类则变为A,BCD,E,F更新簇类间的相似矩阵若簇类E和F的相似度最高归为一类则变为A,BCD,EF重复第四步簇类BCD和EF相似度最高合并为一个簇则变为A,BCDEF最后合并A,BCDEF为一个簇类结束

7.2

自顶乡下的层次聚类最开始所有的对象均属于一个cluster每次按一定的准则将某个cluster划分为多个cluster如此往复直至每个数据点均属于一个cluster

自底向上

自底向上是将每个数据点看做一个簇每次计算相似度合并如此循环下去直至属于一个簇为止

7.3

此算法是构造一个棵二叉树用叶节点代表数据而二叉树的每一个内部节点代表一个聚类这是一个自下而上的聚类。

7.3.2

与Single-Linkage算法相似Complete-Linkage的迭代思想是一样的不同的是合并类时Single-Linkage是用两个类中距离最小的两个点作为类之间的距离而Complete-Linkage恰恰相反用距离最远的两个数据点之间的距离作为两个类之间的距离

密度聚类

前面介绍了划分聚类和层次聚类算法下面介绍密度聚类算法DB-SCAN算法

DB-SCAN是一个基于密度的聚类。

在聚类不规则形态的点如果用K-means效果不会很好。

而通过DB-SCAN就可很好地把同一密度区域的点聚在一起

8.1

密度直达directly-density-reachable密度可达directly-reachable核心对象之间可以是密度直达或密度可达

密度相连density-connected所有密度可达的和点点就是构成密度相连

对xi和xj若存在xk使得xi与xj均由xk密度可达则称xi和xj密度相连

8.2

MinPts则这个点是核心对象。

把所有的核心对象放到一个集合中。

从这个核心对象集合中随机找一个核心对象判断其它的数据点与它是否密度直达如果是则归入聚类簇中。

继续判断其它点与聚类簇中的点是否密度直达直到把所有的点都检查完毕这时候归入聚类簇中的所有点是一个密度聚类。

标签： 比价网做网站套餐门户定制网站建设公司

上一篇：郑州儿童摄影网站的SEO外包服务费用是多少？
下一篇：苏州地区网站建设优化服务的价格如何？

为您推荐

SEO优化服务概述

作为专业的SEO优化服务提供商，我们致力于通过科学、系统的搜索引擎优化策略，帮助企业在百度、Google等搜索引擎中获得更高的排名和流量。我们的服务涵盖网站结构优化、内容优化、技术SEO和链接建设等多个维度。

百度官方合作伙伴白帽SEO技术数据驱动优化效果长期稳定

SEO优化核心服务

网站技术SEO

网站结构优化 - 提升网站爬虫可访问性
页面速度优化 - 缩短加载时间，提高用户体验
移动端适配 - 确保移动设备友好性
HTTPS安全协议 - 提升网站安全性与信任度
结构化数据标记 - 增强搜索结果显示效果

内容优化服务

关键词研究与布局 - 精准定位目标关键词
高质量内容创作 - 原创、专业、有价值的内容
Meta标签优化 - 提升点击率和相关性
内容更新策略 - 保持网站内容新鲜度
多媒体内容优化 - 图片、视频SEO优化

外链建设策略

高质量外链获取 - 权威网站链接建设
品牌提及监控 - 追踪品牌在线曝光
行业目录提交 - 提升网站基础权威
社交媒体整合 - 增强内容传播力
链接质量分析 - 避免低质量链接风险

SEO服务方案对比

服务项目	基础套餐	标准套餐	高级定制
关键词优化数量	10-20个核心词	30-50个核心词+长尾词	80-150个全方位覆盖
内容优化	基础页面优化	全站内容优化+每月5篇原创	个性化内容策略+每月15篇原创
技术SEO	基本技术检查	全面技术优化+移动适配	深度技术重构+性能优化
外链建设	每月5-10条	每月20-30条高质量外链	每月50+条多渠道外链
数据报告	月度基础报告	双周详细报告+分析	每周深度报告+策略调整
效果保障	3-6个月见效	2-4个月见效	1-3个月快速见效

SEO优化实施流程

我们的SEO优化服务遵循科学严谨的流程，确保每一步都基于数据分析和行业最佳实践：

网站诊断分析

全面检测网站技术问题、内容质量、竞争对手情况，制定个性化优化方案。

关键词策略制定

基于用户搜索意图和商业目标，制定全面的关键词矩阵和布局策略。

技术优化实施

解决网站技术问题，优化网站结构，提升页面速度和移动端体验。

内容优化建设

创作高质量原创内容，优化现有页面，建立内容更新机制。

外链建设推广

获取高质量外部链接，建立品牌在线影响力，提升网站权威度。

数据监控调整

持续监控排名、流量和转化数据，根据效果调整优化策略。

SEO优化常见问题

SEO优化一般需要多长时间才能看到效果？

SEO是一个渐进的过程，通常需要3-6个月才能看到明显效果。具体时间取决于网站现状、竞争程度和优化强度。我们的标准套餐一般在2-4个月内开始显现效果，高级定制方案可能在1-3个月内就能看到初步成果。

你们使用白帽SEO技术还是黑帽技术？

我们始终坚持使用白帽SEO技术，遵循搜索引擎的官方指南。我们的优化策略注重长期效果和可持续性，绝不使用任何可能导致网站被惩罚的违规手段。作为百度官方合作伙伴，我们承诺提供安全、合规的SEO服务。

SEO优化后效果能持续多久？

通过我们的白帽SEO策略获得的排名和流量具有长期稳定性。一旦网站达到理想排名，只需适当的维护和更新，效果可以持续数年。我们提供优化后维护服务，确保您的网站长期保持竞争优势。

你们提供SEO优化效果保障吗？

我们提供基于数据的SEO效果承诺。根据服务套餐不同，我们承诺在约定时间内将核心关键词优化到指定排名位置，或实现约定的自然流量增长目标。所有承诺都会在服务合同中明确约定，并提供详细的KPI衡量标准。

SEO优化效果数据

基于我们服务的客户数据统计，平均优化效果如下：

+85%

自然搜索流量提升

+120%

关键词排名数量

+60%

网站转化率提升

3-6月

平均见效周期

行业案例 - 制造业

优化前：日均自然流量120，核心词无排名
优化6个月后：日均自然流量950，15个核心词首页排名
效果提升：流量增长692%，询盘量增加320%

行业案例 - 电商

优化前：月均自然订单50单，转化率1.2%
优化4个月后：月均自然订单210单，转化率2.8%
效果提升：订单增长320%，转化率提升133%

行业案例 - 教育

优化前：月均咨询量35个，主要依赖付费广告
优化5个月后：月均咨询量180个，自然流量占比65%
效果提升：咨询量增长414%，营销成本降低57%

为什么选择我们的SEO服务

专业团队

10年以上SEO经验专家带队
百度、Google认证工程师
内容创作、技术开发、数据分析多领域团队
持续培训保持技术领先

数据驱动

自主研发SEO分析工具
实时排名监控系统
竞争对手深度分析
效果可视化报告

透明合作

清晰的服务内容和价格
定期进展汇报和沟通
效果数据实时可查
灵活的合同条款

我们的SEO服务理念

我们坚信，真正的SEO优化不仅仅是追求排名，而是通过提供优质内容、优化用户体验、建立网站权威，最终实现可持续的业务增长。我们的目标是与客户建立长期合作关系，共同成长。

SEO教程