96SEO 2026-02-20 05:10 18
之前的课程中#xff0c;我们学习了两个最重要的回归方法#xff0c;一个线性回归#xff0c;一个逻辑回归。

也讲解了为什么学习机器学习要从逻辑回归和线性回归讲起。
因为我们在解决问题的时候#xff0c;有限选择简单的假设#xff0c;越复杂的模型…
之前的课程中我们学习了两个最重要的回归方法一个线性回归一个逻辑回归。
也讲解了为什么学习机器学习要从逻辑回归和线性回归讲起。
因为我们在解决问题的时候有限选择简单的假设越复杂的模型出错的概率也就越高。
还记得咱们上一节课中最后所说的吗在完成了基本回归之后该如何去判断一个模型的好坏以及如何调整和优化。
在这之前我们发现了一个麻烦事。
就是我们现在需要去观测我们的分类结果我们不得不再去执行一遍我们之前的训练程序拿到最后的分类结果
Predicated:0这很麻烦训练结果每次要使用的时候都需要运行一次这样非常的麻烦。
现在我想要把这个model不要每一次都训练一下,而是要把它做一个保存下次用的时候不需要从头到尾再训练一次。
现在现在可以给他做一个persistence做一个留存。
现在就是要做这么一件事情。
open(logistic_regression.model,
finished并且最后我得到了三个文件分别是logistic_regression.model,
现在就可以把训练完成的model做保存了。
之后我们用Pytorch,
到这一步之后我们上一节上所写的代码就可以暂时不用了。
不过为了整个代码的完整性我仍然将其又在本节课的10.ipynb内些了一遍。
那么我们要用的时候怎么办呢如果要用这个对象的时候将我们之前对文件操作的代码拿过来然后将其中的wb参数改成rb然后再将二进制文件读取一遍
open(logistic_regression.model,
binary也就是读取二进制文件。
然后为了在测试的时候避免混乱让我接下来所使用的文件使用的是我重新读取的模型而不是之前训练时生成的的我将重新读取的这几个文件命名为model_rw_r,b_r。
那再之后虽然不用重新训练了但是数据还是要读取一遍的并且按照训练数据的规则重新整理好,
dataset[target]greater_***n_most
np.percentile(dataframe[price],
np.random.choice(range(len(rm)),
很多人在学习过程中会觉得「评测指标」是一个没有那么有趣的事情。
比方说咱们学模型学算法就可以去写程序可以运行写出来的时候会感觉还蛮酷的。
但是评测指标呢很多同学就觉得不是那么有趣。
其实我想告诉大家评测指标是一个非常重要的东西。
好比完成任何一个任务不管你现在是完成普通的编程任务还是要完成一个公司的市场行为、运营行为。
一般来说越复杂的任务只要把评价指标评价方式做对这个任务基本上就已经完成了一半了。
对于我们来说工作的时候要知道对于一个机器学习任务能找到正确的评测指标这个机器学习任务就已经成功一半了。
plt.plot(losses)loss持续下降意味着误差越来越小?方向是对的?测试值更加接近真实值?更精确的说法是它在逼近最优解但是效果是不是特别好还不知道。
二分类再假设有一个模型在执行的时候它会知道咱们做的是一个二分类问题那么结果就是不是1就是0。
这个时候模型有可能偷懒那给到的数据就会是随机的好吧开个玩笑其实就只是因为数据不足造成给到的数据过于随机
2.2300784022072975现在我们拿到的值为2.23不过要记得咱们这只是一个假设值。
那这个时候引入我们刚才谈到的loss的曲线loss是持续下降的当它下降到最低的值的时候依然比这个2.23还要高那就说明这个模型都还没有随机猜测的准确度高。
这个情况其实是经常会遇到的一个问题你会看到你的的模型一直在下降下降的非常好但是一做实际测试的时候效果就特别差。
再换个说法就是这个模型跑的时候瞎猜的值都有2.23的准确但是loss虽然一只在下降一只下降到了3。
虽然loss看起来在下降但是这整个结果都不是太好。
瞎猜的时候的准确度loss值我们称为这个模型的Baseline。
你的值最起码要比这个好。
所以就如之前所的loss持续下降意味着模型在向着最优的方向在寻找但并不意味着结果就会很好因为有可能连瞎猜都不如。
loss一直在下降,但是我们现在想知道的是有多少个label预测对了。
先建立两个变量来分别存储数据
random_test_indices:...true_labels.append(y)predicated_labels.append(predicate_label)然后分别获得了两组数据一个是true_labels一个是predicated_labels。
有了这两组数据之后我们来定义一个accuracy
len(ytrues)accuracy(true_labels,
假设有一个警察局要在100个人里边判断谁是犯罪分子。
现在我们知道有3个是犯罪分子然后警察说这100个人全部都是犯罪分子。
那么现在准确度有多少
然后又有一个警察站出来说这100个人都不是犯罪分子那他的准确度又是多少
警察b有97个标签都说对了这会给人一种错觉好像他预测的很准确的。
但是其实a和b两个人都判断的不准确。
那我们这个时候就需要引出一个定义Precision。
precision也是准确度的意思和accuracy不同点是accuracy的对比是对比目标和现有值是否匹配匹配的就算正确。
而precision除了看是否匹配之外还要目标值也就是positive。
这里举个例子说明一下比如我们去检测是否有新冠病毒那么目标是为了检测出有新馆病毒的人那么呈阳性的人就是我们的positive
那么我们precision除了预测出有新冠和没有新冠的人之外有新冠的人也需要一一对应上也就是positive要正确。
如果是写代码的话也就是将之前的accuracy拿过来改改就可以直接用了
预测标签是1的里面正确的比例是多少positives_pred
len(positives_pred)precision(true_labels,
0.8333333333333334先将预测为1也就是预测呈阳性的目标放到positives_pred中再来检测一下在这些预测出来的目标中预测对的有多少。
除此之外之外还有一个值叫做recall它的意思是在实际的positive里有多少比例被找到了。
len(true_positive)recall(true_labels,
0.8064516129032258好我们再来复盘一下这三个值一个是accuracy,
accuracy就是预测值和实际值有多少是一样的。
但是有可能会在实际场景都不是很均衡。
precision是拿到预测后的目标值然后拿这些目标的实际值去比较看有多大比例是一样的。
recall是先拿到实际的目标值然后拿目标预测值比较看有多大比例是一样的。
根据我们之前说的警察抓坏人的那个假设我们现在来做一个测试假设我们现在好人有90个坏人有10个。
random.shuffle(people)现在警察a来了就判断说全部都是好人把他们全部都放了吧。
这样的话它的accuracy是多少呢accuracy就是预测的只要是实际值的那个label就行。
我们来看看
0.9我们看这个准确度就会很高这个也能理解因为警察a将这100个人中的90个好人全部判断准确了对吧
0precision警告我们分母为0报错了。
那分母为什么为0呢因为a说了所有都是好人那么预测的目标值也就是分母上的坏人就为0。
而recall呢结果为0。
这是因为分母上的坏人实际值虽然为10但是预测的目标值也就是分子上为0。
那结果肯定是为0。
本来a的accuracy是0.9别人还以为准确度很高结果一个坏人都没抓住。
这肯定不行。
1.0虽然accuracy和precision都不高但是似乎目标都被找出来了。
颇有一种「宁可错杀1000不可放过一个」的感觉。
好那下一节课中我们要来看看关于precition和recall的一个矩阵这个矩阵呢将会是我们工作中分析结果常用的。
PrecisionRecalltpfptptpfntp
作为专业的SEO优化服务提供商,我们致力于通过科学、系统的搜索引擎优化策略,帮助企业在百度、Google等搜索引擎中获得更高的排名和流量。我们的服务涵盖网站结构优化、内容优化、技术SEO和链接建设等多个维度。
| 服务项目 | 基础套餐 | 标准套餐 | 高级定制 |
|---|---|---|---|
| 关键词优化数量 | 10-20个核心词 | 30-50个核心词+长尾词 | 80-150个全方位覆盖 |
| 内容优化 | 基础页面优化 | 全站内容优化+每月5篇原创 | 个性化内容策略+每月15篇原创 |
| 技术SEO | 基本技术检查 | 全面技术优化+移动适配 | 深度技术重构+性能优化 |
| 外链建设 | 每月5-10条 | 每月20-30条高质量外链 | 每月50+条多渠道外链 |
| 数据报告 | 月度基础报告 | 双周详细报告+分析 | 每周深度报告+策略调整 |
| 效果保障 | 3-6个月见效 | 2-4个月见效 | 1-3个月快速见效 |
我们的SEO优化服务遵循科学严谨的流程,确保每一步都基于数据分析和行业最佳实践:
全面检测网站技术问题、内容质量、竞争对手情况,制定个性化优化方案。
基于用户搜索意图和商业目标,制定全面的关键词矩阵和布局策略。
解决网站技术问题,优化网站结构,提升页面速度和移动端体验。
创作高质量原创内容,优化现有页面,建立内容更新机制。
获取高质量外部链接,建立品牌在线影响力,提升网站权威度。
持续监控排名、流量和转化数据,根据效果调整优化策略。
基于我们服务的客户数据统计,平均优化效果如下:
我们坚信,真正的SEO优化不仅仅是追求排名,而是通过提供优质内容、优化用户体验、建立网站权威,最终实现可持续的业务增长。我们的目标是与客户建立长期合作关系,共同成长。
Demand feedback