当前位置: 首页 > news >正文

这世上又多了一只爬虫(spiderflow)

让我们一起默念:

接着大声喊出来:
一!只!爬!虫!呀!爬!呀!爬!
爬!到!南!山!就!不!爬!啦!

怎么样,没想到吧? 这样的爬虫怕不怕?
在这里插入图片描述
好了,言归正传,到底又多了一只什么爬虫呢?


一、目标

为了分析国内上市公司的财务表现,需抓一批财务报告。

二、调研

上市公司财报哪家强? 要钱的统统走开,咱们只看以下几个source:

  • 巨潮资讯
  • 同花顺
  • 东方财富

通过比较,博主选择了同花顺仅供学习,别无它途哦

三、实施

在正式实施前,强调一点,博主依然使用spiderflow作为利器,完成本次实践。

1. 打开财报页面

在这里插入图片描述
在这里插入图片描述

2. 分析财报页面

通过简单分析可知,财报数据是动态数据渲染而成。进一步抓包,可知来源于一个json文件:在这里插入图片描述
如此,遍简单了。爬起来~

3. 新建一个爬虫

爬虫大致长这样:
在这里插入图片描述
其中,关键一步是找json,需要指定类似以下的路径https://basic.10jqka.com.cn/api/stock/finance/600327_debt.json,红色数字代表上市公司代码,可作为一个变量进行替换。这样就能满足批量下载了。

在这里插入图片描述
在这里插入图片描述

到此,大功告成。值得一提,本文仅用于学习交流,切勿他用。

在这里插入图片描述

http://www.lryc.cn/news/373205.html

相关文章:

  • SpringMVC框架学习笔记(七):处理 json 和 HttpMessageConverter 以及文件的下载和上传
  • 八、BGP
  • 有监督学习——支持向量机、朴素贝叶斯分类
  • 自动化测试文档
  • vue-i18n使用步骤详解(含完整操作步骤)
  • XXE漏洞修补:保护您的系统免受XML外部实体攻击
  • 去除upload的抖动效果
  • 什么是 Linux ?(Linux)
  • uni-app 怎么在tabbar使用阿里图标库
  • 勒索病毒剖析
  • 【C++11】第一部分(一万六千多字)
  • FPGA专项课程即将开课,颁发AMD官方证书
  • C++ shared_ptr
  • 2024.6.15
  • 堆栈溢出的攻击 -fno-stack-protector stack smash 检测
  • 掌握特劳特定位理论核心,明晰企业战略定位之重
  • RAGFlow 学习笔记
  • 使用Docker-Java监听Docker容器的信息
  • Spring Boot + Mybatis Plus实现登录注册
  • IDEA创建web项目
  • 二手物品交易系统的设计
  • 探索大数据在信用评估中的独特价值
  • MFC基础学习应用
  • Gradle实现类似Maven的profiles功能
  • 【强化学习】gymnasium自定义环境并封装学习笔记
  • TLE9879的基于Arduino调试板SWD刷写接口
  • 基于 Delphi 的前后端分离:之五,使用 HTMX 让页面元素组件化之面向对象的Delphi代码封装
  • 讲透计算机网络知识(实战篇)01——计算机网络和协议
  • 8个宝藏APP,个个都牛逼哈拉!
  • 使用docker构建java应用