当前位置: 首页 > news >正文

【利用二手车数据进行可视化分析】

利用二手车数据进行可视化分析

  • 查看原始数据
  • 去除重复数据
  • 需求分析
    • 1.统计全国总共有多少量二手车,用KPI图进行展示
    • 2.统计安徽总共有多少量二手车,用KPI图进行展示
    • 3.统计合肥总共有多少量二手车,用KPI图进行展示
    • 4.取最贵的10辆二手车信息,用列表图展示
    • 5.各品牌二手车数量,取Top10用饼图展示
    • 6.各品牌价格最贵的二手车
    • 7.各品牌价格最低的二手车
    • 8.各城市二手车数量,取Top10用饼图展示
    • 9.几几年款的二手车平均价格走势,取最近10年的数据用折线图展示
    • 10.统计每座城市二手车数量,并通过地图展示
  • 利用生成的表在FineBI中绘图
    • 链接数据库
    • 传入数据库中的表
    • 新建分析进行绘图

查看原始数据

查看MySQL中爬取完成的数据发现有十万多条,接下来清理一下这些数据看看有没有重复的数据将这些数据剔除
在这里插入图片描述

select car_id from car_info group by car_id

可以看到不重复的数据有七万多条,有将近三万条的重复数据,接下来就去除这些重复数据
在这里插入图片描述

去除重复数据

先查看一下重复的数据是什么样的
查看一下重复车型的car_id 有好多重复10次以上 复制一些看看这些车的信息

select car_id,count(*) cnt 
from car_info 
group by car_id
having cnt>2
order by cnt descc6a6fa03344447c1
d6d5b6c63184f41cselect * from car_info where car_id = 'c6a6fa03344447c1'

在这里插入图片描述
在这里插入图片描述
可以看到一些一样的车不止挂在一个地方而是挂在离一个城市周边的地区都会挂牌,导致重复的数据很高,现在我们根据车辆的一些信息分类然后将数据进行清洗。
按照车型,公里数,首付,总价这些车子定量不变的信息进行分类,可以看到清洗出来了8万条数据,这些数据都是不相同的,因为有些车子虽然car_id相等 但是车子的型号等信息不相等。

# 去除重复数据
select car_id,car_info,car_year,car_mile,car_price_total,car_price_pyment
from car_info 
group by car_id,car_info,car_year,car_mile,car_price_total,car_price_pyment

在这里插入图片描述
接着将清洗好的数据保存到另一张表下,避免修改源数据,

# 将清洗好的数据保存在另外一张表下 因为使用group分组 所以用max就可以很容易取到city
create table if not exists car_detail as
(select car_id,car_info,car_year,car_mile,car_price_total,car_price_pyment,max(city_name) as city,max(city_code) as city_code,max(created_at) as creat_time,max(updated_at) as update_time
from car_info 
group by car_id,car_info,car_year,car_mile,car_price_total,car_price_pyment)

在这里插入图片描述

需求分析

画图需要使用python绘图或者使用专用软件绘图
使用python绘图可以使用pyecharts
这里我使用软件fineBI绘图

1.统计全国总共有多少量二手车,用KPI图进行展示

create table if not exists ques1 as 
(select count(distinct car_id) as all_car
from car_detail)

2.统计安徽总共有多少量二手车,用KPI图进行展示

create table if not exists ques2 as 
(select count(distinct car_id) as anhui_car 
from car_detail
where city_code in ('hf','wuhu','bengbu','bozhou','hn','mas','huaibei'
,'tongling','anqing',"huangshan",'chuzhou','chizhou','fy','suzhou','la','xuancheng'))

3.统计合肥总共有多少量二手车,用KPI图进行展示

create table if not exists ques3 as 
(select count(distinct car_id) as hf_car
from car_detail
where city_code = 'hf') 

4.取最贵的10辆二手车信息,用列表图展示

create table if not exists ques4 as 
(select city,car_info,car_id,car_mile,car_price_total
from car_detail
order by car_price_total desc
limit 10)

5.各品牌二手车数量,取Top10用饼图展示

create table if not exists ques5 as
(select bend,count(*) as cont
from 
(# SUBSTRING_INDEX(str,delim,count) 类似与split的函数
select SUBSTRING_INDEX(t1.car_info,'-',1) as bend
from car_detail as t1) as tt1
group by bend
order by cont desc
limit 10)

6.各品牌价格最贵的二手车

create table if not exists ques6 as
(select bend,ROUND(max(tt1.car_price_total),2) as max_price
from (select SUBSTRING_INDEX(t1.car_info,'-',1) as bend,t1.car_price_total
from car_detail as t1) as tt1
group by tt1.bend
order by max_price desc)

7.各品牌价格最低的二手车

create table if not exists ques7 as
(select bend,ROUND(min(tt1.car_price_total),2) as min_price
from (select SUBSTRING_INDEX(t1.car_info,'-',1) as bend,t1.car_price_total
from car_detail as t1) as tt1
group by tt1.bend
order by min_price)

8.各城市二手车数量,取Top10用饼图展示

create table if not exists ques8 as
(select city,count(*) as cont
from car_detail 
group by city
order by cont desc)

9.几几年款的二手车平均价格走势,取最近10年的数据用折线图展示

create table if not exists ques9 as
(select t1.car_first_year as car_year,round(avg(t1.car_price_total),2) as price 
from 
(select year(car_year) as car_first_year,car_price_total
from car_detail) as t1
group by t1.car_first_year
order by car_year desc)

10.统计每座城市二手车数量,并通过地图展示

create table if not exists ques10 as
(select city,count(*) as car_number
from car_detail
group by city
order by car_number desc)

利用生成的表在FineBI中绘图

链接数据库

在这里插入图片描述

传入数据库中的表

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

新建分析进行绘图

在这里插入图片描述
绘图完成
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

http://www.lryc.cn/news/257009.html

相关文章:

  • 快速测试 3节点的redis sentinel集群宕机2个节点以后是否仍能正常使用
  • echarts词云图echarts-wordcloud使用方法
  • 二叉树的OJ练习(二)
  • uni-app 微信小程序之自定义navigationBar顶部导航栏
  • 前端入门:HTML初级指南,网页的简单实现!
  • 低多边形3D建模石头材质纹理贴图
  • 【华为OD题库-081】最长的元音子串长度-Java
  • 第9节:Vue3 指令
  • B028-JDBC基础
  • ngixn 准备
  • 生活小记录
  • Diary22-全网最全的CSS3.0讲解
  • LAMP和分离式LNMP部署
  • 基于Java房屋租赁管理系统
  • windows安装protoc、protoc-gen-go、protoc-gen-go-grpc
  • macOS 获取文件夹大小
  • Ultimate VFX
  • 一个通用游戏后台的设计模式实践总结
  • Kubernetes - 为什么 K8S 在容器里不能调用自己?
  • 电机:有刷直流电机的原理
  • 小黑子——springBoot基础
  • Flink流批一体计算(24):Flink SQL之mysql维表实时关联
  • 鸿蒙(HarmonyOS)应用开发——从网络获取数据(题目答案)
  • 力扣:197. 上升的温度(Python3)
  • uniApp应用软件在运行时,不符合华为应用市场审核标准。解决方案合集!
  • c#编码技巧(十五):新语法糖record深入分析
  • Java IO流(五)(字符集基础知识简介)
  • 周周爱学习之Redis重点总结
  • 免费的SEO外链发布工具,提升排名的利器
  • 腾讯字节常考的linux命令