当前位置: 首页 > news >正文

爬虫实战 - 微博评论数据可视化

简介:

我们都知道在数据比较少的情况下,我们是可以很轻易的获取到数据中的信息。但是当数据比较庞大的时候呢,我们就很难看出来了。尤其是面对现如今数以万计的数据,就更了。

不过好在我们可以通过计算机来帮我们进行分析,其中比较高效的手段便是数据可视化了。通过将数据进行可视化,我们可以让数据开口说话。进而有利于我们进行数据的分析,让我们可以更加快速的读懂数据。

回顾:

书接上回,咱们之前写了一个获取微博评论的爬虫。获取到的数据如下:
在这里插入图片描述
在这里插入图片描述
可以看到,上面的的数据其实凭借肉眼看的话很难看出来其中的规律。同时这些数据也是非常不直观的。那么我们就可以通过数据可视化的方式对这些数据进行可视化了。

下面是使用pyecharts对我们爬取到的数据进行可视化的效果。
第一个是关于评论数据中粉丝较多的用户的粉丝数据
在这里插入图片描述
第二个是关于评论数据中粉丝较多的用户的关注数据
在这里插入图片描述
接下来呢就是对评论发布的地址进行可视化了,从图中可以考到哪个地方的人看评论的人数比较的多。具体效果可以看下面的视频。

再者呢就是对时间进行统计了,就是看哪一个时间评论发布的最多
在这里插入图片描述
下面的这个表示的是关于所有评论中,地址中前20的ip地址出现次数。从这里可以看到,这条微博评论中北京的评论用户最多
在这里插入图片描述
同时我们还可以对评论者的性别进行统计,下面是该微博评论中性别的分布情况
在这里插入图片描述
最后一个就是评论中用户的简介数据可视化,也就是说在这条微博中发布评论的用户的个性签名,然后对这些签名数据进行词云展示。

在这里插入图片描述
评论数据可视化视频介绍:

爬虫实战-微博评论可视化

以上就是本次分享的全部内容了。
由于笔者能力有限,在问题表述方面可能有不准确的地方,还请多多包涵!!!
完整源码: 爬虫实战- 微博评论数据可视化

http://www.lryc.cn/news/277616.html

相关文章:

  • python装饰器嵌套基础
  • C语言之三子棋小游戏的应用
  • 优雅处理并发:Java CompletableFuture最佳实践
  • 熟悉HDFS常用操作
  • Adobe XD是什么?探索这款创新的用户体验设计工具
  • java常用应用程序编程接口(API)——ArrayList概述及使用案例
  • 2024年了,Layui再战三年有问题不?
  • 消息队列-RocketMQ-概览与搭建
  • Vue3技术解析(小册子)
  • 即将消失的五种编程语言?
  • c++学习:STL库(框架)+字符串模板类string+vector容器+list链表
  • 2023年全国职业院校技能大赛(高职组)“云计算应用”赛项赛卷④
  • 使用Scikit Learn 进行识别手写数字
  • GB/T 15036-2018 实木地板检测
  • 基于ElementUI封装的下拉树选择可搜索单选多选清空功能
  • 计算机网络-各层协议
  • LeetCode 84:柱状图中的最大矩形
  • 老生重谈:大模型的「幻觉」问题
  • golang实现skiplist 跳表
  • 尝试OmniverseFarm的最基础操作
  • 第28关 k8s监控实战之Prometheus(二)
  • 基于 SpringBoot + magic-api + Vue3 + Element Plus + amis3.0 快速开发管理系统
  • Kafka(四)Broker
  • 代码随想录第五十二天——最长递增子序列,最长连续递增序列,最长重复子数组
  • 【大数据架构】OLAP实时分析引擎选型
  • 代码随想录刷题题Day29
  • CVE-2023-51385 OpenSSH ProxyCommand命令注入漏洞
  • 如何寻找到相对完整的真正的游戏的源码 用来学习?
  • 数模学习day11-系统聚类法
  • SpringBoot+Redis实现接口防刷功能