当前位置: 首页 > news >正文

scrapy爬取城市天气数据

scrapy爬取城市天气数据

  • 一、创建scrapy项目
  • 二、修改settings,设置UA,开启管道
  • 三、编写爬虫文件
  • 四、编写items.py
  • 五、在weather.py中导入WeatherSpiderItem类
  • 六、管道中存入数据,保存至csv文件
  • 七、完整代码

一、创建scrapy项目

先来看一下爬取的字段情况:
在这里插入图片描述

本次爬取城市天气数据的scrapy项目使用pycharm创建。首先,使用pycharm创建一个项目并打开该项目,创建的项目名称为scrapyProject。打开pycharm的终端,输入命令scrapy startproject weatherspider,接下来在终端输入命令cd weatherspider进入该目录下。然后输入命令scrapy genspider weather www.xxx.com,这里的weather是spider的名字。项目便创建好了。

二、修改settings,设置UA,开启管道

打开settings.py,将ROBOTSTXT_OBEY改为False,LOG_LEVEL设置为ERROR,将User-Agent改为自己的User-Agen,如下图所示:
在这里插入图片描述
在settings.py文件中取消管道代码的注释,如下图所示:
在这里插入图片描述

<

http://www.lryc.cn/news/407375.html

相关文章:

  • 一天搞定React(5)——ReactRouter(下)【已完结】
  • 微信小程序之计算器
  • 【logstash】logstash使用多个子配置文件
  • 暴风骑士S9电摩上市,定义青少年骑行安全新标准
  • spring security如何适配盐存在数据库中的密码
  • Go语言编程 学习笔记整理 第2章 顺序编程 后半部分
  • 美团后端二面
  • 学懂C语言(十六):对C语言作用域规则 局部变量、全局变量的认识
  • 关于TS(typescript)的理论知识
  • 【OpenCV C++20 学习笔记】基本图像容器——Mat
  • 枚举单例是怎么保证线程安全和防止反射的
  • 传知代码-智慧医疗:纹理特征VS卷积特征(论文复现)
  • 数据结构中的八大金刚--------八大排序算法
  • ACC2.【C语言】经验积累 栈区简单剖析
  • c# 索引器
  • 低代码如何加速数字化转型
  • Pytest进阶之fixture的使用(超详细)
  • GitHub 详解教程
  • 边界网关IPSEC VPN实验
  • 力扣高频SQL 50题(基础版)第六题
  • 在一个事物方法中开启新事物,完成对数据库的修改
  • ffmpeg的vignetting filter
  • 商场导航系统:从电子地图到AR导航,提升顾客体验与运营效率的智能解决方案
  • vue3中父子组件的双向绑定defineModel详细使用方法
  • 耳机、音响UWB传输数据模组,飞睿智能低延迟、高速率超宽带uwb模块技术音频应用
  • webpack配置报错:Invalid options object.
  • Java 并发编程:一文了解 Java 内存模型(处理器优化、指令重排序与内存屏障的深层解析)
  • 谷粒商城实战笔记-64-商品服务-API-品牌管理-OSS前后联调测试上传
  • Springboot 开发之 RestTemplate 简介
  • Django transaction.atomic()事务处理