当前位置: 首页 > news >正文

《数据思维》之数据可视化_读书笔记

文章目录

  • 系列文章目录
  • 前言
  • 一、pandas是什么?
  • 二、使用步骤
    • 1.引入库
    • 2.读入数据
  • 总结


前言

数据之道,路漫漫其修远兮,吾将上下而求索。


一、数据可视化

        最基础的数据可视化方法就是统计图。一个好的统计图应该满足四个标准:准确、有效、简洁、美观!由此对应的就是统计图的“实力派”(准确+有效)和“偶像派”(简洁+美观)。

        实力派:准确+有效

                准确是统计图最基本的要求,即要使用正确的统计图区描述不同类型的数据。比如,对于离散型变量(性别,职业等),可以画饼状图或者柱状图;对于连续型变量(年龄、工资),可以画直方图或者箱线图;对于时间序列变量(GDP、CPI等),可以画折线图。这就好比不同的季节穿不同的衣服。

        偶像派:简洁+美观

                一个美观的统计图应该同时满足准确、有效和简洁的标准。

二、图例

        柱状图:

                柱状图是针对离散型变量(比如性别)所做的图。每根柱子代表一个类别(男性或者女性),柱子的高度是此类别的频数。作图后要有适当的评述。

                注意:

                        1. 作图后要有适当的评述。

                        2.当出现《题西林壁》中的“远近高低各不同”,有两个解决办法:一种是将特别少的归为其他,然后将柱子安装从高到低的顺序排列(能让你的图美观很多);二是干脆就只画具有可比性的三个信用等级,然后文字说明一下其他等级的频数特别少。

                        3.距离产生美,柱子间要留出空隙,让人喘口气。

三、折线图   

        折线图的三大特点:

                第一,看趋势。指标随时间的变化,呈递增、递减还是持平的趋势。

                第二,看周期。指标的取值是都呈现一定的周期规律。

                第三,看突发事件。某个事件的发生,出现波峰或者波谷。

                第四,对比多个指标的变化。

         注意:经济指标的变化趋势惯用柱状图,而非折线图。

  

三、散点图

        散点图是用于展示两个(连续型)变量的一种常用统计图。散点图中的每一个点,由横纵两个坐标值组成。从散点图可以解读两个变量的相关关系:正线性相关、负线性相关、非线性相关、不相关。

        注意:相关关系不等于因果关系,人们渴求因果关系,但常用的许多统计工具(回归分析等),探求的只是相关关系。

        除了已知的两个变量,当数据中还有其他变量信息时,可以通过修改变“点”的颜色、形状和大小来传递更多信息。

四、茎叶图

    茎叶图可以同时展示原始数据和分布的形状,图形由“茎”和“叶”两部分组成。通常以数据的高位数字作为树茎,低位数字作为树叶。

   

              


总结

http://www.lryc.cn/news/523616.html

相关文章:

  • 深度学习常见术语解释
  • 重温STM32之环境安装
  • 使用Flask和Pydantic实现参数验证
  • python_在钉钉群@人员发送消息
  • C语言之装甲车库车辆动态监控辅助记录系统
  • 线性代数概述
  • 使用 ChatGPT 生成和改进你的论文
  • Linux命令行工具-使用方法
  • RV1126+FFMPEG推流项目(7)AI音频模块编码流程
  • 四、华为交换机 STP
  • 服务器卡顿是否等同于遭受CC攻击?
  • 【机器学习实战入门】使用Pandas和OpenCV进行颜色检测
  • 一文大白话讲清楚webpack基本使用——1——完成webpack的初步构建
  • RabbitMQ基础篇
  • GPT-5 传言:一场正在幕后发生的 AI 变革
  • CSS布局与响应式
  • C++的auto_ptr智能指针:从诞生到被弃用的历程
  • iOS - Objective-C 底层实现中的哈希表
  • 什么是软件架构
  • 【Golang/nacos】nacos配置的增删查改,以及服务注册的golang实例及分析
  • RabbitMQ集群安装rabbitmq_delayed_message_exchange
  • Linux UDP 编程详解
  • 【2024年华为OD机试】(B卷,100分)- 计算最接近的数 (Java JS PythonC/C++)
  • Pytorch 自学笔记(三):利用自定义文本数据集构建Dataset和DataLoader
  • QT 使用QSqlTableModel对数据库进行创建,插入,显示
  • 如何学习Transformer架构
  • 浅谈云计算22 | Kubernetes容器编排引擎
  • 计算 SAMOut V3 在将词汇表从1万 增加到6千万的情况下能够减少多少参数
  • 03.选择排序
  • 02_登录窗口