当前位置: 首页 > news >正文

python爬虫--tx动漫完整信息抓取

python爬虫--tx动漫完整信息抓取

  • 一、采集主页信息
  • 二、采集详情页信息
  • 三、完整代码

一、采集主页信息

先看一下采集到的信息,结果保存为csv文件:
在这里插入图片描述

在这里插入图片描述
打开开发者工具,找到数据接口。
在这里插入图片描述
使用xpath提取详情页url。

二、采集详情页信息

在这里插入图片描述
如上图所示,使用xpath提取详情页的标题、作者、评分、人气、评论人数等数据。

三、完整代码

import csv
http://www.lryc.cn/news/457952.html

相关文章:

  • 《使用Java做爬虫和使用python做爬虫哪个好》
  • 如果我想开发一个APP,需要准备哪些材料呢
  • 告别论文初稿焦虑!ChatGPT让你轻松完成写作!
  • mongodb 数据迁移,亲测成功!
  • 如何使用ssm实现疫情居家办公OA系统
  • 深入了解 MySQL 中的 JSON_CONTAINS
  • 宝藏推荐:精选十款知识库搭建软件
  • go语言接口设计三国人物
  • day-63 优质数对的总数 II
  • 基于 Prometheus+Grafana+Alertmanager 搭建 K8S 云监控告警平台(附配置告警至QQ、钉钉)
  • C++ | Leetcode C++题解之第461题汉明距离
  • ElasticSearch备考 -- Update by query Reindex
  • 从认识String类,到走进String类的世界
  • Vue入门-指令修饰符-@keyup.enter
  • 【Kubernetes】常见面试题汇总(五十九)
  • 【ARM Linux驱动开发】嵌入式ARM Linux驱动开发基本步骤
  • SpinalHDL之设计错误(Design Errors)(一)
  • QT + opengl 让2d贴图动起来
  • 【selenium】webdriver测试脚本
  • 工业自动化中的关键信号:开关量、模拟量与脉冲量
  • VMware vCenter Server 8.0U3c 发布下载,修复 U3b 更新停止响应的问题
  • Java面试宝典-Java集合02
  • HJ212-2017协议详解:工业物联网环境监测标准简单了解
  • 【Golang】Go语言Seeker接口与文件断点续传实战
  • 【MySQL】基本查询(下):更新、删除
  • django urlconf路由分发
  • The 2024 ICPC Kunming Invitational Contest K. Permutation(交互 期望)
  • TensorFlow与Pytorch的转换——1简单线性回归
  • 短剧小程序短剧APP在线追剧APP网剧推广分销微短剧小剧场小程序集师知识付费集师短剧小程序集师小剧场小程序集师在线追剧小程序源码
  • AI与物理学的交汇:Hinton与Hopfield获诺贝尔物理学奖