当前位置: 首页 > news >正文

seaborn库图形进行数据分析(基于tips数据集)

Seaborn 是一个基于 matplotlib 的数据可视化库,可以用来绘制各种统计图表,包括散点图、条形图、折线图、箱线图等。Seaborn 提供了一些用于美化图表的默认样式和颜色主题,使得生成的图表更具有吸引力。下面是一些 Seaborn 库的常用功能和用法。

import seaborn as sns#seaborn图形进行数据分析
df=sns.load_dataset('tips')
df.head()#显示前五行
'''结果:total_bill 	tip 	sex 	smoker 	day 	time 	size
0 	16.99 	  1.01  	Female 	   No 	Sun 	Dinner 	 2
1 	10.34 	  1.66 	    Male 	   No 	Sun 	Dinner 	 3
2 	21.01 	  3.50  	Male 	   No 	Sun 	Dinner 	 3
3 	23.68 	  3.31  	Male 	   No 	Sun 	Dinner 	 2
4 	24.59 	  3.61 	    Female 	   No 	Sun 	Dinner 	 4
'''df
'''结果:total_bill 	tip 	sex 	smoker 	day 	time 	size
0 	   16.99 	1.01  	Female 	No  	Sun 	Dinner 	 2
1 	   10.34 	1.66 	Male 	No  	Sun 	Dinner 	 3
2 	   21.01 	3.50  	Male 	No  	Sun 	Dinner 	 3
3 	   23.68 	3.31  	Male 	No 	    Sun 	Dinner 	 2
4 	   24.59 	3.61 	Female 	No 	    Sun 	Dinner 	 4
... 	... 	... 	... 	... 	... 	... 	...
239 	29.03 	5.92 	Male 	No 	    Sat 	Dinner 	 3
240 	27.18 	2.00 	Female 	Yes 	Sat 	Dinner 	 2
241 	22.67 	2.00 	Male 	Yes 	Sat 	Dinner 	 2
242 	17.82 	1.75 	Male 	No 	    Sat 	Dinner 	 2
243 	18.78 	3.00 	Female 	No 	    Thur 	Dinner 	 2244 rows × 7 columns
'''df.dtypes
'''结果:
total_bill     float64
tip            float64
sex           category
smoker        category
day           category
time          category
size             int64
dtype: object'''

 1、相关性

df.corr()#三个字段的相关性
'''结果:total_bill 	tip 	     size
total_bill 	1.000000 	0.675734 	0.598315
tip 	    0.675734 	1.000000 	0.489299
size 	    0.598315 	0.489299 	1.000000'''
sns.heatmap(df.corr())#用热区图来表示相关性

 

2、变量分析

sns.jointplot(x='tip',y='total_bill',data=df,kind='hex')#单变量分析,kind用什么表示,该图是蜂窝表示

sns.jointplot(x='tip',y='total_bill',data=df,kind='reg')#单变量分析,该图是用回归表示

 

sns.pairplot(df)#匹配图,在同一数据行中,一个变量与另一个变量的值相匹配,最后显示所有变量与所有其它变量的匹配

 

sns.pairplot(df,hue='sex')#多加一个变量

 

 

sns.pairplot(df,hue='smoker')#多加一个变量

三、统计数 

df['smoker'].value_counts()
'''结果:
No     151
Yes     93
Name: smoker, dtype: int64
'''df['sex'].value_counts()
'''结果:
Male      157
Female     87
Name: sex, dtype: int64
'''
sns.countplot(x='sex',data=df)

 

sns.countplot(y='sex',data=df)

 

四、 特征值分布

sns.distplot(df['tip'])#帮助我们检查单特征分布,比例

 

sns.distplot(df['tip'],kde=False,bins=20)#帮助我们检查单特征分布,数量

五、多变量

sns.barplot(x='sex',y='total_bill',data=df)#两变量做x,y轴,柱状图

 

sns.boxplot(x='day',y='total_bill',data=df,palette='rainbow')#盒图,palette调色板

sns.boxplot(data=df,orient='v')#垂直

sns.boxplot(x='day',y='total_bill',hue='smoker',data=df)#盒图,三变量

sns.violinplot(x="total_bill",y="day",data=df,palette="rainbow")#小提琴图,帮助我们从核密度估计和箱型图两方面看到数据发布

sns.violinplot(y="total_bill",x="day",data=df,palette="rainbow")#小提琴图,帮助我们从核密度估计和箱型图两方面看到数据发布

http://www.lryc.cn/news/261244.html

相关文章:

  • AC843. n皇后问题--60
  • Js WebSocket类,收发Json,带心跳,断线重连
  • VBA技术资料MF96:单字段多条件高级筛选
  • 电子取证中Chrome各版本解密Cookies、LoginData账号密码、历史记录
  • Axure元件基本介绍进阶
  • 安卓11添加切换以太网动态静态方法
  • 初级数据结构(五)——树和二叉树的概念
  • pdf读取内容缺失(漏字/文字丢失)问题
  • c#面试基础语法——现有⼀个整数number,请写⼀个⽅法判断这个整数是否是2的N次⽅
  • 27系列DGUS智能屏发布:可实时播放高清模拟信号摄像头视频
  • YOLOv8改进 | 2023主干篇 | 替换LSKNet遥感目标检测主干 (附代码+修改教程+结构讲解)
  • 【工具】VUE 前端列表拖拽功能代码
  • 人工智能与量子计算:开启未知领域的智慧之旅
  • 2023了,前端实现AI电子秤思路分析
  • CSS学习
  • Flask基本用法:一个HelloWorld,搭建服务、发起请求
  • Tomcat-安装部署(源码包安装)
  • 【Hadoop_06】MapReduce的概述与wc案例
  • Qt点击子窗口时父窗口标题栏高亮设计思路
  • 掌握iText:轻松处理PDF文档-高级篇-添加水印
  • 深度学习基本概念
  • 2023年最详细的:本地Linux服务器安装宝塔面板,并内网穿透实现公网远程登录
  • 基于ssm金旗帜文化培训学校网站的设计与开发论文
  • 【Java】猜数字小游戏
  • 汽车EDI:Chrysler EDI项目案例
  • Locust:可能是一款最被低估的压测工具
  • 用23种设计模式打造一个cocos creator的游戏框架----(十八)责任链模式
  • 100天精通风控建模(原理+Python实现)——第9天:风控建模中为什么需要特征工程?
  • 【PHP】计算某个特定时间戳距离现在的天数
  • lv12 uboot移植深化 9