当前位置: 首页 > news >正文

爬虫学习笔记-scrapy爬取电影天堂(双层网址嵌套)

 

1.终端运行scrapy startproject movie,创建项目

2.接口查找

 3.终端cd到spiders,cd scrapy_carhome/scrapy_movie/spiders,运行 scrapy genspider mv https://dy2018.com/

4.打开mv,编写代码,爬取电影名和网址

5.用爬取的网址请求,使用meta属性传递name ,callback调用自定义的parse_second

6.导入ScrapyMovieItem,将movie对象传递给管道下载

7.settings开启管道

8.下载爬取的movie对象存储到movie.json中

 9.爬取的结果

http://www.lryc.cn/news/302812.html

相关文章:

  • Unity笔记:数据持久化的几种方式
  • MySQL 基础知识(八)之用户权限管理
  • QT编写工具基本流程(自用)
  • 代码随想录算法训练营第三六天 | 无重叠区间、划分字母区间、合并区间
  • DP读书:《openEuler操作系统》(十)套接字 Socket 数据传输的基本模型
  • 抓住母亲节销售机会:Shopee 平台选品策略大揭秘
  • Mysql如何优化数据查询方案
  • SwiftUI 更自然地向自定义视图传递参数的“另类”方式
  • Word第一课
  • 【Vue3】路由传参的几种方式
  • 突破编程_C++_面试(高级特性(1))
  • django请求生命周期流程图,路由匹配,路由有名无名反向解析,路由分发,名称空间
  • @ 代码随想录算法训练营第8周(C语言)|Day54(动态规划)
  • Flask 学习100-Flask-SocketIO 结合 xterm.js 实现网页版Xshell
  • Springboot AOP开发
  • office的excel中使用,告诉我详细的解决方案,如何变成转化为金额格式
  • 灾后重建中GIS技术的关键作用与案例分析
  • java环境安装
  • 如何在iStoreOS软路由系统中安装cpolar实现公网远程本地电脑桌面
  • appium实现自动化测试原理
  • Linux:docker搭建redis集群(3主3从扩容缩容 哈希槽分配)
  • Linux程序性能分析60秒+
  • mmap映射文件使用示例
  • Linux命令:stat命令
  • 学会自幂数
  • 支付宝支付
  • qt中读写锁与互斥锁的区别
  • Why Not Http?
  • 基于JAVA的停车场收费系统 开源项目
  • 在PyTorch中,如何查看深度学习模型的每一层结构?