当前位置: 首页 > news >正文

Python数据分析篇--NumPy--入门

 我什么也没忘,但是有些事只适合收藏。不能说,也不能想,却又不能忘。       -- 史铁生 《我与地坛》

NumPy相关知识

1. NumPy,全称是 Numerical Python,它是目前 Python 数值计算中最重要的基础模块。

2. NumPy 是针对多维数组的一个科学计算模块,这个模块封装了很多数组类型的常用操作。

3. NumPy 中最重要的对象是多维数组。

创建多维数组 

1. 将一个列表作为参数传入 numpy 中的 array() 方法即可创建一个多维数组。

2. 我们也可以使用 numpy 中的 ones() 方法或者 zeros() 方法。

3. np.ones() 和 np.zeros() 的参数用于指定生成的多维数组里有多少个元素。

4. 默认生成的是浮点数,numpy 会省略小数点后的 0,因此 1.0 和 0.0 变成了 1. 和 0.。

5. 如果我们想要生成整数的话,可以传入 dtype='类型' 来指定类型。

5. 一般我们使用 import numpy as np ,即用 np 来简写 numpy。

import numpy as np
list=np.array([1,2,3])
print(list)
print(type(list))
#输出结果
#[1 2 3]
#<class 'numpy.ndarray'>one=np.ones(5)
print(one)
print(type(one))
#[1. 1. 1. 1. 1.]
#<class 'numpy.ndarray'>zero=np.zeros(3)
print(zero)
print(type(zero))
#[0. 0. 0.]
#<class 'numpy.ndarray'>one=np.ones(5,dtype='int')
print(one)
print(type(one))
#输出结果 [1 1 1 1 1]

 多维数组的加减乘除

1. 列表间只有加法操作,作用是将两个列表的元素合并在一起。

2. 而多维数组间可以进行加减乘除的四则运算。

3. 运算规则也很简单:将两个数组中对应位置的元素一一进行运算。

import numpy as npdata = np.array([1, 2])
ones = np.ones(2)
print(data + ones)
#最终输出 [2. 3.]data = np.array([1, 2])
print(data + 1)
# 输出:[2 3]

多维数组的索引

1. 多维数组的索引与字符串、列表的索引规则相同。

data = np.array([1, 2, 3])
print(data[0])
#输出 1

 多维数组的分片

1. 多维数组的分片与字符串、列表的分片规则相同。

2. data[m : n] ,分片是左闭右开区间,即包含 m 不包含 n。

3. 冒号前后的值是可以省略的:省略后冒号前默认为 0,冒号后默认为列表的长度。

4. 对列表分片后的数据进行更改不会影响原数据,但对多维数组分片后的数据进行更改会影响到原数据。

5. 分片支持传入第三个参数——步长,即分片时每隔几个数据取一次值。步长的默认值为 1,当步长为负数时,会将顺序反转。

data = np.array([1, 2, 3])
print(data[0:2])  # 获取索引为 0 和 1 的元素
# 输出:[1 2]data = np.array([1, 2, 3])
# 获取前 2 个元素
print(data[:2])
# 输出:[1 2]# 获取后 2 个元素
print(data[-2:])
# 输出:[2 3]# 获取所有元素
print(data[:])
# 输出:[1 2 3]lst_data = [1, 2, 3]
lst_data2 = lst_data[:]
lst_data2[0] = 6
print(lst_data)
# 输出:[1, 2, 3]arr_data = np.array([1, 2, 3])
arr_data2 = arr_data[:]
arr_data2[0] = 6
print(arr_data)
# 输出:[6 2 3]data = np.array([1, 2, 3, 4, 5, 6])
print(data[::2])  # 省略前两个参数
# 输出:[1 3 5]data = np.array([1, 2, 3, 4, 5, 6])
print(data[::-1])  # 省略前两个参数
# 输出:[6 5 4 3 2 1]

简单的数据分析

集中趋势

1. 集中趋势所反映的是一组数据所具有的共同趋势,它代表了一组数据的总体水平。

2. 其常用指标有平均数、中位数和众数。

离中趋势

1. 离中趋势是指一组数据中各数据值以不同程度的距离偏离其中心(平均数)的趋势。

2. 其常用指标有极差、方差和标准差。

3. 极差是一组数据的最大值减去最小值得到的,反应了数据变动的最大范围。

4. 方差和标准差都能反映数据的离散程度,也就是数据的波动程度。方差和标准差的值越小,说明数据越稳定。 

数据分析操作方法 

 1. 在 numpy 上调用对应函数并传入数据如:np.std(data)。

import numpy as npplayer1 = np.array([4, 16, 5, 8, 11, 40, 4, 12, 23, 13])
player2 = np.array([9, 8, 12, 11, 9, 10, 13, 10, 11, 13])
player3 = np.array([4, 6, 8, 5, 6, 7, 6, 5, 8, 6])
print("1号玩家平均数",np.median(player1))
print("2号玩家平均数",np.median(player2))
print("3号玩家平均数",np.median(player3))
print("1号玩家方差",np.std(player1))
print("2号玩家方差",np.std(player1))
print("3号玩家方差",np.std(player1))#输出结果
#1号玩家平均数 11.5
#2号玩家平均数 10.5
#3号玩家平均数 6.0
#1号玩家方差 10.44222198576529
#2号玩家方差 10.44222198576529
#3号玩家方差 10.44222198576529

致谢

 感谢您花时间阅读这篇文章!如果您对本文有任何疑问、建议或是想要分享您的看法,请不要犹豫,在评论区留下您的宝贵意见。每一次互动都是我前进的动力,您的支持是我最大的鼓励。期待与您的交流,让我们共同成长,探索技术世界的无限可能!

http://www.lryc.cn/news/451202.html

相关文章:

  • OJ在线评测系统 后端 判题机模块预开发 架构分析 使用工厂模式搭建
  • linux 目录文件夹操作
  • (Linux驱动学习 - 4).Linux 下 DHT11 温湿度传感器驱动编写
  • 前端登录页面验证码
  • 【鸿蒙】HarmonyOS NEXT应用开发快速入门教程之布局篇(上)
  • 使用 Nginx 和 Gunicorn 部署 Flask 项目详细教程
  • linux中bashrc和profile环境变量在Shell编程变量的传递作用
  • 数据结构-4.2.串的定义和基本操作
  • fastzdp_redis第一次开发, 2024年9月26日, Python操作Redis零基础快速入门
  • 文件名:\\?\C:\Windows\system32\inetsrv\config\applicationHost.config错误:无法写入配置文件
  • Optiver股票大赛Top2开源!
  • Maven 实现依赖统一管理
  • 【最新】微信小程序连接onenet——stm32+esp8266+onenet实现查看温湿度,控制单片机
  • 差分(续前缀和)(含一维二维)
  • 【STM32-HAL库】自发电型风速传感器(使用STM32F407ZGT6)(附带工程下载链接)
  • 【计算机毕业设计】springboot就业信息管理系统
  • 实用工具推荐---- PDF 转换
  • 安宝特案例 | 某知名日系汽车制造厂,借助AR实现智慧化转型
  • RabbitMQ基本原理
  • 【NodeJS】npm、yarn、pnpm当前项目设置国内镜像源
  • 25考研咨询周开启,西安电子科技大学是否改考408??
  • git(1) -- 环境配置
  • Windows安装Vim,并在PowerShell中直接使用vim
  • 力扣(leetcode)每日一题 983 最低票价 |动态规划
  • 【漏洞复现】VEXUS多语言货币交易所存在未授权访问漏洞
  • 基于SpringBoot+Vue+MySQL的个性化电影推荐
  • ASP.NET MVC-异步发送post请求+文件下载
  • Unity 2D RPG Kit 学习笔记
  • 联想天逸100使用笔记
  • 【AI知识点】嵌入向量(Embedding Vector)