当前位置: 首页 > news >正文

使用xpath规则进行提取数据并存储

下载lxml

!pip install lxml
import requests
headers={"user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/122.0.6261.95 Safari/537.36"
}
url="https://movie.douban.com/chart"
response = requests.get(url,headers=headers)

构建xpath的对象

from lxml import etree
tree = etree.HTML(response.text)

使用xpath规则进行提取

lists = tree.xpath("//div[@class='pl2']/a/span")
for list in lists:print(list.text)

输出
在这里插入图片描述
获取a链接

links = tree.xpath("//div[@class='pl2']/a/@href")
for link in links:print(link)

输出
在这里插入图片描述

数据存储

存储音乐

import requests
url="http://m801.music.126.net/20241218224557/987ec52295da84beb07585379448bf96/jdymusic/obj/wo3DlMOGwrbDjj7DisKw/35836053117/6356/740c/463a/5ad8c9d7ac9f59ea148b9cdf1802e87a.mp3"
response=requests.get(url)
content=response.content
with open("music.mp3","wb") as file:file.write(content)

存储文本
建议用csv

import csv
data=[[1,2,3],[4,5,6],[1,3,5]]
with open("data.csv","w",encoding="utf-8") as file:  #如果不想被覆盖,可以把“w”改查“a”就会追加csv_writer=csv.writer(file)csv_writer.writerows(data)#writerows添加多个元素csv_writer.writerow([8,8,8,8])#writerow添加一个元素
http://www.lryc.cn/news/505759.html

相关文章:

  • 【物联网技术与应用】实验3:七彩LED灯闪烁
  • 素数回文数的个数
  • 车辆重识别代码笔记12.18
  • selenium 在已打开浏览器上继续调试
  • Sentry日志管理thinkphp8 tp8 sentry9 sentry8 php8.x配置步骤, tp8自定义异常处理类使用方法
  • 【经验分享】容器云搭建的知识点
  • Java对集合的操作方法
  • FreeRTOS--基础知识
  • Node的学习以及学习通过Node书写接口并简单操作数据库
  • 【Linux探索学习】第二十二弹——用户缓冲区:深入解析操作系统中数据交互时的缓冲区机制
  • Cesium-(Primitive)-(CylinderOutlineGeometry)
  • 【ETCD】【源码阅读】深入分析 storeTxnWrite.Put方法源码
  • MySQL技术:深入理解索引与优化
  • 【广东-东莞】《东莞市政府投资信息化项目造价指南》-省市费用标准解读系列26
  • 8、基于SpringBoot的房屋租赁系统
  • SLM510A系列——24V,15到150mA单通道可调电流线性恒流LED驱动芯片
  • 深度学习试题及答案解析(一)
  • 【钉钉群聊机器人定时发送消息功能实现】
  • uni-app多环境配置动态修改
  • verilog代码连线集成工具的实践
  • 【深入STL:C++容器与算法】深度解析string类的使用
  • 【ChatGPT】解锁AI思维链:如何让机器像人类一样思考?
  • 用 Python 从零开始创建神经网络(十七):回归(Regression)
  • gentoo安装Xfce桌面
  • 阿尔茨海默症数据集,使用yolo,voc,coco格式对2013张原始图片进行标注,可识别轻微,中等和正常的症状
  • 【物联网技术与应用】实验4:继电器实验
  • lvs介绍与应用
  • Group FLUX - User Usage Survey Report
  • XXE靶机攻略
  • 第78期 | GPTSecurity周报