当前位置: 首页 > news >正文

使用影刀RPA实现快递信息抓取

最近公司项目有个需求,要求抓取快递单号快递信息,比如签收地点、签收日期等。该项目对应的快递查询网站是一个国外的网站,他们有专门的快递平台可以用于查询。该平台提供了快递接口进行查询,但需要付费。同时也提供了免费的查询窗口,一次最多可以查询25个快递单号。我们的快递单号比较多,有几千个,这时候RPA工具就派上用场啦。

我们的任务很简单,就是根据Excel清单里面提供的快递单号,在对应位置的单元格写入获取到的签收信息即可。涉及到的技术点如下:

读取Excel

这个点需要说明一下,影刀RPA提供了数据表格以及Excel表格。这两个功能的区别就在于使用Excel表格必须要安装Office,否则无法使用其功能。而数据表格更通用,更像是一个内存型的数据表格,不需要安装Office。

在这里插入图片描述

模拟批量提交查询快递单号信息

因为我是25个快递单号一组提交查询,抓取到信息保存,再提交25个新的快递单号查询,这样反复循环。网站格式上面要求每一个快递单号一行,最多25行。如图所示,最后一行的时候多一个换行,可以加个按键BackSpace,去除最后一行的换行,然后提交查询。
在这里插入图片描述

抓取带分页的快递信息

有两点需要注意:

  1. 首先要选择多页,此外要指定抓取的页数,因为我是25个一批,页面每页显示5个快递信息,那么就是5页。
  2. 我勾选了保存至数据表格,那么我也可以操作这个数据表格写入Excel。
    在这里插入图片描述

写入Excel

抓取数据到数据表格后,就可以操作数据表格,写入Excel。
在这里插入图片描述
当然上图中,我也是25个一组获取到快递信息后,就及时写入Excel。这样保证如果中途中断,之前抓取过的信息仍然会保留。

上面用到的pitch2是一个插入Python代码段。影刀RPA就是这个好处,可以直接使用Python的能力嵌入到影刀中,开发非常方便。

在这里插入图片描述

总结

  • 其实我之前是想通过爬虫程序去完成的,但是自从用了RPA工具就发现RPA做这类数据抓取的应用,效率更高。
  • RPA跟爬虫的区别就在于,RPA最大化的模拟了人的鼠标点击和键盘操作,让对方的网站感觉是一个人在操作,而不是什么程序,这样被封杀的概率会降低。
http://www.lryc.cn/news/623302.html

相关文章:

  • C++ 最短路Dijkstra
  • 9.从零开始写LINUX内核——设置中断描述符表
  • Python 类元编程(元类的特殊方法 __prepare__)
  • Flink Stream API 源码走读 - 总结
  • 楼宇自控系统赋能建筑全维度管理,实现环境、安全与能耗全面监管
  • STM32硬件SPI配置为全双工模式下不要单独使用HAL_SPI_Transmit API及HAL_SPI_TransmitReceive改造方法
  • 【时时三省】(C语言基础)共用体类型数据的特点
  • Langfuse2.60.3:独立数据库+docker部署及环境变量详细说明
  • Java 中重载与重写的全面解析(更新版)
  • Mybatis-3自己实现MyBatis底层机制
  • 从冒泡到快速排序:探索经典排序算法的奥秘(二)
  • PHP反序列化的CTF题目环境和做题复现第1集
  • 企业运维规划及Linux介绍虚拟环境搭建
  • python---包
  • 一文速通Python并行计算:14 Python异步编程-协程的管理和调度
  • CF每日3题(1500-1700)
  • P2169 正则表达式
  • w嵌入式分享合集66
  • 【Bluedroid】A2DP控制通道UIPC机制深度解析(btif_a2dp_control_init)
  • Java8~Java21重要新特性
  • JAVA面试汇总(四)JVM(一)
  • 028 动静态库 —— 动态库
  • duiLib 实现鼠标拖动标题栏时,窗口跟着拖动
  • Vue 3.5重磅更新:响应式Props解构,让组件开发更简洁高效
  • 分享一个Oracle表空间自动扩容与清理脚本
  • CPP多线程3:async和future、promise
  • MATLAB基础训练实验
  • 超越“调参”:从系统架构师视角,重构 AI 智能体的设计范式
  • 深度剖析Redisson分布式锁项目实战
  • 【数据分享】大清河(大庆河)流域上游土地利用