96SEO 2026-02-20 08:41 0
析和beautifulsoup标签解析所以今天的博客将围绕另外一种数据解析方法它就是xpath模块解析话不多说进入内容

Language它是一种用来确定XML文档中某部分位置的语言。
xpath是最常用且最便捷高效的一种解析方式通用型强其不仅可以用于python语言中还可以用于其他语言中数据解析建议首先xpath。
实例化一个etree的对象且需要将被解析的页面源代码数据加载到该对象中
调用etree对象中的xpath方法结合着xpath表达式实现标签的定位和内容的捕获
#从本地加载源码实例化一个etree对象。
必须是本地的文件不能是字符串
tree.xpath(//div[classtang]//a)
tree.xpath(//div[classtang]//a/text())
从下面的结果来看我们打印机html其实就是一个python对象etree.tostring(html)则是补全html的基本写法补全了缺胳膊少腿的标签。
3、获取某个标签的内容(基本使用)注意获取a标签的所有内容a后面就不用再加正斜杠否则报错。
html.xpath(/html/body/div/ul/li/a)
html.xpath(/html/body/div/ul/li/a/text())
etree.tostring(html,pretty_printTrue)
5、打印指定路径下a标签的属性可以通过遍历拿到某个属性的值查找标签的内容
html.xpath(/html/body/div/ul/li/a/href)
6、我们知道我们使用xpath拿到得都是一个个的ElementTree对象所以如果需要查找内容的话还需要遍历拿到数据的列表。
html.xpath(/html/body/div/ul/li/a[hreflink2.html]/text())
7、上面我们找到全部都是绝对路径每一个都是从根开始查找下面我们查找相对路径例如查找所有li标签下的a标签内容。
8、上面我们使用绝对路径查找了所有a标签的属性等于href属性值利用的是/—绝对路径下面我们使用相对路径查找一下l相对路径下li标签下的a标签下的href属性的值注意a标签后面需要双//。
html.xpath(//li/a[hreflink2.html])
html.xpath(//li[last()]/a/text())
html.xpath(//li[last()-1]/a/text())
https://bj.58.com/ershoufang/p1/
requests.get(url,headersheaders,timeout3).text
tree.xpath(//span[classcontent-title]/text())
#获取所有//span标签为content-title的文本内容,列表形式
open(58房价.txt,modew,encodingutf-8)
r:fp.writelines(str(r_list))print(r_list)案例2获取豆瓣top榜电影信息这个是老生常谈的话题了
fhttps://movie.douban.com/top250?start{page*25}filterheaders
requests.get(url,headersheaders)tree
tree.xpath(//*[idcontent]/div/div[1]/ol/li/div/div[1]/a/href)#
tree.xpath(//*[idcontent]/div/div[1]/ol/li/div/div[2]/div[1]/a/span[1]/text())for
zip(href_list,name_list):f.flush()
requests.get(url,headersheaders)html
tree.xpath(//*[idinfo]/span[1]/span[2]/a/text())[0]#
re.findall(rpropertyv:genre(.*?)/span,html)type_
tree.xpath(//*[idcontent]/h1/span[2]/text())[0]time
tree.xpath(//*[idinterest_sectl]/div[1]/div[2]/strong/text())[0]#
tree.xpath(//*[idinterest_sectl]/div[1]/div[2]/div/div[2]/a/span/text())[0]print(name,dir,type_,country,time,rate,people)
打印结果csvwriter.writerow((name,dir,type_,country,time,rate,people))
open(03-movie-xpath.csv,a,encodingutf-8,newline)as
写入表头标题csvwriter.writerow((电影名称,导演,电影类型,国家,上映年份,评分,评论人数))for
作为专业的SEO优化服务提供商,我们致力于通过科学、系统的搜索引擎优化策略,帮助企业在百度、Google等搜索引擎中获得更高的排名和流量。我们的服务涵盖网站结构优化、内容优化、技术SEO和链接建设等多个维度。
| 服务项目 | 基础套餐 | 标准套餐 | 高级定制 |
|---|---|---|---|
| 关键词优化数量 | 10-20个核心词 | 30-50个核心词+长尾词 | 80-150个全方位覆盖 |
| 内容优化 | 基础页面优化 | 全站内容优化+每月5篇原创 | 个性化内容策略+每月15篇原创 |
| 技术SEO | 基本技术检查 | 全面技术优化+移动适配 | 深度技术重构+性能优化 |
| 外链建设 | 每月5-10条 | 每月20-30条高质量外链 | 每月50+条多渠道外链 |
| 数据报告 | 月度基础报告 | 双周详细报告+分析 | 每周深度报告+策略调整 |
| 效果保障 | 3-6个月见效 | 2-4个月见效 | 1-3个月快速见效 |
我们的SEO优化服务遵循科学严谨的流程,确保每一步都基于数据分析和行业最佳实践:
全面检测网站技术问题、内容质量、竞争对手情况,制定个性化优化方案。
基于用户搜索意图和商业目标,制定全面的关键词矩阵和布局策略。
解决网站技术问题,优化网站结构,提升页面速度和移动端体验。
创作高质量原创内容,优化现有页面,建立内容更新机制。
获取高质量外部链接,建立品牌在线影响力,提升网站权威度。
持续监控排名、流量和转化数据,根据效果调整优化策略。
基于我们服务的客户数据统计,平均优化效果如下:
我们坚信,真正的SEO优化不仅仅是追求排名,而是通过提供优质内容、优化用户体验、建立网站权威,最终实现可持续的业务增长。我们的目标是与客户建立长期合作关系,共同成长。
Demand feedback