96SEO 2026-02-19 21:57 2
(以大堆为例)1、堆的定义2、堆的初始化3、堆的销毁4、堆的打印5、堆的插入6、堆顶元素的获取7、堆的删除8、堆元素个数的获取8、堆的判空10、堆简单的应用三、堆的创建1、向上调整建堆2、向下调整建堆四、堆的应用1、堆排序2、TOP-K问题一、二叉树的顺序结构及实现

普通的二叉树是不适合用数组来存储的因为可能会存在大量的空间浪费。
而完全二叉树更适合使用顺序结构存储。
现实中我们通常把堆(一种二叉树)使用顺序结构的数组来存储需要注意的是这里的堆和操作系统虚拟进程地址空间中的堆是两回事一个是数据结构一个是操作系统中管理内存的一块区域分段。
}把它的所有元素按完全二叉树的顺序存储方式存储在一个一维数组中并满足:
K_{2i1}KiK2i1且Ki;K2∗i2(KiK2i1且KiK2∗i2)i01⋅⒉...K_i;
i01·⒉...Ki;K2∗i2(KiK2i1且KiK2∗i2)i01⋅⒉...则称为小堆(或大堆)。
将根节点最大的堆叫做最大堆或大根堆根节点最小的堆叫做最小堆或小根堆。
在前一篇文章中我们也讲过,左孩子都是奇数右孩子都是偶数并且孩子和父亲下标也是有一定关系的我们也可以通过找规律得到下面的关系:
//偶数会被取整数因此可以直接按照左孩子公式反推二、堆的简单实现
由于堆比较适合用数组存储我们可以按照顺序表的结构来进行定义但是切记数组存储是物理结构我们要把这个物理结构给抽象为完全二叉树。
堆的初始化我们可以给指针a开辟空间,也可以不开辟空间这里选择不开辟空间。
堆的销毁我们可以直接将空间进行释放然后将指针置空size与capacity置成0就行了。
由于我们是使用数组实现堆我们可以直接遍历一遍数组将它们打印出来就行了。
堆的插入就有一些复杂了我们的插入数据以后要保证插入数据后的堆还是一个大堆不然就破坏了堆的结构。
①首先在我们插入数据子节点之前原始堆就要满足堆的结构否则就是前面的代码出现了问题与我们插入的数据无关
②然后插入的子节点要与其父节点进行比较如果小于其父节点则不交换正常插入。
如果其插入的子节点大于父节点就要进行向上调整交换这个交换次数是不确定的可能是一次也可能是两次不过最多就是树的高度hlog2Nh\log_2Nhlog2N次(NNN为节点个数),这也就是说我们的堆的插入是时间复杂度是O(log2n)O(\log_2n)O(log2n)
接下来就是我们要根据这两种情况写出相应的代码了这个时候这个孩子和父亲下标关系就很重要了,通过这个关系我们就能由子节点找到父节点由父节点找到子节点了。
sizeof(HPDateType)*new_capacity);//realloc对于没有进行动态内存分配过的指针
new_capacity;}//数据插入php-a[php-size]
data;php-size;//向上调整AdjustUp(php-a,php-size-1);
//child0说明子节点已经调整到了堆顶已经不需要再进行调整了。
{if
//更改父节点的下标方便继续与下面新的子节点比较}else{break;//比较不满足条件说明数据经过调整后已经符合大堆了}}
对于堆来说堆顶的数据一定是堆里面最大或最小的数所以堆顶数据的获取还是很有必要的它的实现也并不复杂。
对于堆的删除一般是删除堆顶元素因为除了堆顶元素其他元素删除的意义并不大但是堆顶的元素删除又会破环堆的结构。
而且如果采用直接删除堆顶元素其他元素向前挪动之后再进行调整的话会有很大的浪费因为数组向前挪动的时间复杂度是O(n)O(n)O(n)。
但是数组的尾删效率很高是O(1)O(1)O(1),所以数组尽量进行尾删。
于是便有了一种良好的先交换再向下调整的算法它的思想是先让堆顶元素与最后一个元素交换位置这样原先的堆顶元素就变成了堆底元素然后删除堆底元素再对堆顶的元素进行向下调整其核心算法就在于向下调整。
向下调整算法要求我们先取堆顶元素的子节点中较大的那个与堆顶元素进行比较如果子节点大于父节点就进行交换然后父节点的下标变到原先子节点的下标再次执行上面的步骤取父节点下面较大的子节点进行比较换位…
1]);php-size--;//向下调整AdjustDown(php-a,php-size,0);
a[parent]){Swap(a[child],a[parent]);parent
}向下调整的算法与向上调整类似这个交换次数是不确定的可能是一次也可能是两次不过最多就是树的高度hlog2Nh\log_2Nhlog2N次(NNN为节点个数),这也就是说我们的堆的删除是时间复杂度也是O(log2n)O(\log_2n)O(log2n)
向上调整算法要求数据插入之前原先的数据已经是一个堆了才能重新建堆。
向下调整算法的要求左右子树必须是一个堆才能调整重新建堆。
堆顶的元素是最大小的元素我们可以取堆顶K次删除K次拿到一个数据集中最大小的前K个。
//打印堆中的元素printf(\n);//选出最大的前五个int
//删除堆顶元素重新定位新的最大的。
}HeapDestroy(hp);
arr[i]);}HeapPrint(hp);printf(\n);//排序while(!HeapEmpty(hp))//只要不为空就一直进行排序。
{printf(%d
HeapTop(hp));HeapPop(hp);}HeapDestroy(hp);return
在上面的代码中我们看到我们经常会用一个数组去创建堆因此我们还是很有必要再写一个函数——堆的创建在上面的代码中我们创建一个堆其实是用的是堆的插入即将数据插入到数组最后再进行向上调整。
这种方法能帮我们完成堆的创建但是它的效率并不是很高我们可以对其做一定优化。
(HPDateType*)malloc(sizeof(HPDateType)
按照最坏的情况来算完全二叉树的最坏情况是满二叉树且每个节点都要调整
向上调整建堆的第一层是不进行调整的设FFF是建堆交换调整的总次数h−1h-1h−1是树的高度NNN是树的结点个数,则有
F21∗122∗223∗3......2h−2∗h−22h−1∗h−1F2^1*12^2*22^3*3......2^{h-2}*h-22^{h-1}*h-1
F21∗122∗223∗3......2h−2∗h−22h−1∗h−1
N20212223......2h−22h−12h−1(2)N2^02^12^22^3......2^{h-2}2^{h-1}2^h-1\tag{2}
F(N1)∗(log2(N1)−2)1(3)F(N1)*(\log_2{(N1)}-2)1\tag{3}
因此向上调整建堆的时间复杂度是O(nlog2n)O(n\log_2n)O(nlog2n)
向下调整算法是有的要求的左右子树必须是一个堆才能调整重新建堆但给我们的数组本身就是乱序的那我们应该怎样才能保证左右子树是一个堆呢
答案是我们从倒数的第一个非叶子节点的子树开始调整一直调整到根节点的树就可以调整成堆。
在这里第一个非叶子节点的子树是28,我们可以通过子节点与父节点的关系找到28的下标然后向下调整让①区域变成堆然后下标减一到18的位置然后向下调整让②区域变成堆然后下标减一到19的位置然后向下调整让③区域变成堆…直到下标为零时再调整一次这样就把堆给建立起来了。
(HPDateType*)malloc(sizeof(HPDateType)
sizeof(HPDateType)*n);//内存拷贝函数for
//利用向下调整算法}}这种建堆算法效率是比较高的我们来求一下它的时间复杂度。
按照最坏的情况来算完全二叉树的最坏情况是满二叉树且每个节点都要调整
由于向下调整建堆是从倒数第二层开始调整的所以我们假设树的高度为hhh,FFF是建堆交换调整的总次数NNN是树的结点个数。
F2h−2∗12h−3∗22h−4∗3......21∗h−220∗h−1(1)F2^{h-2}*12^{h-3}*22^{h-4}*3......2^1*h-22^0*h-1\tag{1}
F2h−2∗12h−3∗22h−4∗3......21∗h−220∗h−1(1)
N20212223......2h−22h−12h−1(2)N2^02^12^22^3......2^{h-2}2^{h-1}2^{h}-1\tag{2}
FN−(log2(N1)1)(3)FN-(\log_2{(N1)}1)\tag{3}
对比我们也可以发现向上调整算法是那一层节点越多向上调整越多而向下调整算法是那一层节点越少向下调整越多。
因此向下调整算法更加优秀
但是上面的应用我们都是借助了堆这个数据结构利用了堆的插入与删除在实际应用时给你一个数组让你进行排序难道我们还要费很大的力气去建堆这样显然太慢了所以我们需要找到一种不用建立堆的数据结构就能进行排序的算法。
首先经过前面的学习我们都知道了每个连续存储的数组可以看成一个完全二叉树因此我们可以利用刚才堆的创建的思路对数组里面的数据进行建堆然后进行排序。
假设我们建立小堆的话第一个元素就不用进行排序了我们从第二个进行排序但是从第二个元素开始重新排序的话我们的堆结构可能就被破坏了不利于我们后续选数据要不就是遍历一遍选一个数这些效率都不太好。
因此小堆并不适合建立升序数组。
我们可以将堆顶元素与堆底元素进行换位这样我们最大的元素就到了正确的位置然后对堆顶元素向下调整一次便可以重新建堆因为左子树与右子树关系没有改变再然后把最后一个元素不看成堆里面的元素再将堆顶元素与堆底元素进行换位这样我们次大的元素就到了正确的位置然后对堆顶元素向下调整一次便可以重新建堆再然后把最后两个元素不看成堆里面的元素如此继续循环往复等数组里面的数被遍历一遍后排序也就结束了另外我们向下调整一次最多交换高度次log2n\log_2nlog2n,因此堆排序的时间复杂度是O(nlog2n)O(n\log_2n)O(nlog2n)。
--Onwhile(parent0){AdjustDown(arr,
arr[end]);//向下调整重新建堆AdjustDown(arr,
在前面堆的简单应用中我们也简单的学习了用堆的数据结构进行解决TOP-K问题我们建立一个大堆对堆顶元素进行删除拿到第一个数据再重新向下调整建堆再对堆顶元素进行删除拿到第二个数据…如此往复便解决了TOP-K的问题。
但是一般情况下TOP-K问题的数据量都比较大我们再利用上面的方法可能就不太行了例如从100亿个数据中选择10个最大的假设全是整数那么需要400亿字节而1G≈10亿字节我们用数组存储这100亿个数就需要40G的内存这显然内存不足于是我们就需要把这么多的数据放进硬盘中了利用文件读取来读取数据可是硬盘中的数据并不能建堆于是我们就要考虑其他的算法了。
我们可以建立一个KK为要想要选取的数的个数个数据的小堆从文件中读取数据与堆顶的元素进行比较如果大于堆顶元素就替换掉堆顶元素然后向下调整重新建立小堆这样经过遍历所有数后想要的K个数就在小堆里面
fail:);return;}//设置随机种子srand(time(NULL));int
i){//插入5个明显更大的数据方便判断TOP-K结果是否正确if
i);randK--;continue;}//造500个随机数val
val);}//关闭文件fclose(pfin);//以读的方式打开文件FILE*
0);}}fclose(pfout);//打印堆中的数据for
作为专业的SEO优化服务提供商,我们致力于通过科学、系统的搜索引擎优化策略,帮助企业在百度、Google等搜索引擎中获得更高的排名和流量。我们的服务涵盖网站结构优化、内容优化、技术SEO和链接建设等多个维度。
| 服务项目 | 基础套餐 | 标准套餐 | 高级定制 |
|---|---|---|---|
| 关键词优化数量 | 10-20个核心词 | 30-50个核心词+长尾词 | 80-150个全方位覆盖 |
| 内容优化 | 基础页面优化 | 全站内容优化+每月5篇原创 | 个性化内容策略+每月15篇原创 |
| 技术SEO | 基本技术检查 | 全面技术优化+移动适配 | 深度技术重构+性能优化 |
| 外链建设 | 每月5-10条 | 每月20-30条高质量外链 | 每月50+条多渠道外链 |
| 数据报告 | 月度基础报告 | 双周详细报告+分析 | 每周深度报告+策略调整 |
| 效果保障 | 3-6个月见效 | 2-4个月见效 | 1-3个月快速见效 |
我们的SEO优化服务遵循科学严谨的流程,确保每一步都基于数据分析和行业最佳实践:
全面检测网站技术问题、内容质量、竞争对手情况,制定个性化优化方案。
基于用户搜索意图和商业目标,制定全面的关键词矩阵和布局策略。
解决网站技术问题,优化网站结构,提升页面速度和移动端体验。
创作高质量原创内容,优化现有页面,建立内容更新机制。
获取高质量外部链接,建立品牌在线影响力,提升网站权威度。
持续监控排名、流量和转化数据,根据效果调整优化策略。
基于我们服务的客户数据统计,平均优化效果如下:
我们坚信,真正的SEO优化不仅仅是追求排名,而是通过提供优质内容、优化用户体验、建立网站权威,最终实现可持续的业务增长。我们的目标是与客户建立长期合作关系,共同成长。
Demand feedback