当前位置: 首页 > news >正文

scrapy解决管道阻塞问题采用threadpool库线程池+twisted同步语法异步编程

实现方法:process_item和download任务函数像下面编写即可,其他管道像往常一样写法

import time
import threadpool
import random
from twisted.internet import deferclass VideoPipeline:def __init__(self):self.pool = threadpool.ThreadPool(10)  # 设置线程数passdef process_item(self, item, spider):""":param item::param spider::return:"""finish_flag = random.randint(0,9)item['finish_flag'] = finish_flag# 线程池异步处理defer_item = defer.Deferred()task = threadpool.WorkRequest(self.download, args=(item,spider,finish_flag,defer_item,))self.pool.putRequest(task)return defer_itemdef download(self,item,spider,finish_flag,defer_item):"""相当于长作业"""time.sleep(random.randint(1,10))if not finish_flag:defer_item.callback(dict())defer_item.callback(item)def process_item2(self, item):""" VideoPipeline 下一个优先级管道类方法"""print(item)if __name__ == '__main__':a = VideoPipeline()for i in range(10):defer_item = a.process_item({},None)defer_item.addCallback(a.process_item2)print(11111111111)time.sleep(50)
http://www.lryc.cn/news/410066.html

相关文章:

  • Axure RP:打造动态交互的大屏可视化设计利器
  • “八股文”在实际工作中是助力、阻力还是空谈
  • 项目开发:@ControllerAdvice注解的基本应用
  • Jmeter三种方式获取数组中多个数据并将其当做下个接口参数入参【附带JSON提取器和CSV格式化】
  • C++入门基础:C++中的循环语句
  • VUE 基础(二)
  • VMware Cloud Foundation ESXi 主机
  • PyTorch深度学习快速入门(下)
  • 轻松入门Linux—CentOS,直接拿捏 —/— <1>
  • pandas安装以及导入CSV
  • 新能源车浪潮来袭,同时存在高压低压系统,如何准确进行高低压布线间距EMC分析?
  • QUIC 协议
  • 【软件测试】--接口测试
  • 【前端】上传视频,截取第一帧图片
  • Redis-GEO数据结构的基本用法
  • 【Linux C | 网络编程】进程池大文件传输的实现详解(三)
  • Mac如何通过SSH连接Github
  • 成就巴西休闲游戏如何借助Google谷歌广告投放优势
  • 利用python检查磁盘空间使用情况
  • 卷积神经网络(五)---图像增强的方法
  • 矩阵常见分解算法及其在SLAM中的应用
  • 【排序】快速排序详解
  • 贪心算法总结(2)
  • 弘景光电:技术实力与创新驱动并进
  • 2024年7月23日~2024年7月29日周报
  • M3U8流视频数据爬虫
  • 保护您的数字财富:模块化沙箱在源代码防泄露中的突破
  • FFmpeg源码:avio_r8、avio_rl16、avio_rl24、avio_rl32、avio_rl64函数分析
  • 如何使用 API 查看极狐GitLab 镜像仓库中的镜像?
  • 软件-vscode-plantUML-IDEA