当前位置: 首页 > news >正文

scrapy的安装和使用

一、scrapy是什么:Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架,可以应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序

二、scrapy的安装:pip install scrapy -i https://pypi.douban.com/simple

983c6a8fa46c4f068b6e5c2f35ee54fc.png三、scrapy项目的创建以及运行

1.win+r 进入终端

cd C:\Users\malongqiang\PycharmProjects\pythonProject\ 爬虫练习1018

注意:路径最好是你python代码放置路径(cd + 选中文件夹拉入终端)

dfb96dc6be08499f828bb13dff023ab0.png2.创建scrapy_baidu_1024文件:scrapy startproject scrapy_baidu_102406127b0e5289460587dfdae9c20ef5fd.png3.创建后的结果:a9bc2abec62c4aff91394117ca10f852.png4.进入spiders文件夹下:cd scrapy_baidu_1024\scrapy_baidu_1024\spiders12b55cf73cc345d0ac04919a9a93ebf9.png5.创建爬虫文件baidu.py:scrapy genspider baidu http://www.baidu.com49c288f2ec0b47d6ac7f7a7c9c9fb2fe.png

f8ca241b4f23425db716caddc249df67.png6.baidu.py的内容:bb1c01afe70f44efb66303a957f1283b.png7.写入要打印的内容:my loveaef16a19192e4f0e81d9482209062b69.png8.运行爬虫文件(baidu):scrapy crawl baidu94f46375fa044836a525e8b0a77a8683.png9.没有结果,爬取失败,原因如下:robots.txt协议不让爬820a7a77c2264a0aa9fa29fc8ed275de.png368d0b56994043a3b82d41ea29e61536.png10.解决办法:找到该目录下的settings注释ROBOTSTXT_OBEY = Truebf244e5ec9dd4f68807e4febee488cf1.png11.重新运行指令,打印出来结果c45a6157d9f94486807bb09407dc7622.png

四、scrapy相关内容资料:f36f36d1abc745d8a81a12ea0978ffc9.png

 

 

http://www.lryc.cn/news/204905.html

相关文章:

  • Kotlin中的异常处理
  • [Ubuntu 18.04] 搭建文件夹共享之Samba服务器
  • 设计模式-装饰器模式
  • 【Vs code调试C++】
  • 使用 C++创建一个简易的数据库管理系统 (DBMS)
  • 简单了解一下:NodeJS的WebSocket网络编程
  • 目标检测技术概述
  • 软件设计原则-开闭原则讲解以及代码示例
  • 分类预测 | MATLAB实现SSA-CNN-GRU-Attention数据分类预测(SE注意力机制)
  • LeetCode--180 连续出现的数字
  • 面试算法34:外星语言是否排序
  • 常用docker命令 docker_cmd_sheet
  • 算法进阶——数组中的逆序对
  • hackmyvm之gift
  • 1024,向着“顶尖程序员“迈进
  • Arcgis 数据操作
  • YoloV7改进策略:SwiftFormer,全网首发,独家改进的高效加性注意力用于实时移动视觉应用的模型,重构YoloV7
  • Day07 Stream流递归Map集合Collections可变参数
  • 8.JavaScript-注释
  • 知识分享|分段函数线性化及matlab测试
  • ant target的depends属性
  • 【三维重建】DreamGaussian:高斯splatting的单视图3D内容生成(原理+代码)
  • 如何使用Flutter开发执行操作系统shell命令的工具
  • 西山居 游戏研发工程师实习生 面经
  • YOLOv8训练自己的数据集+改进方法复现
  • 尚硅谷kafka3.0.0
  • 【Andriod】Appium的不同版本(Appium GUI、Appium Desktop、Appium Server )的安装教程
  • leetcode:面试题 17.04. 消失的数字(找单身狗/排序/公式)
  • 基于SpringBoot的时间管理系统
  • centos搭建elastic集群