当前位置: 首页 > article >正文

Python数据分析及可视化中常用的6个库及函数(二)

Python数据分析及可视化中常用的6个库及函数(二)

       摘要:以下是Python数据分析及可视化常用的6个库的详细介绍,包括它们的概述以及每个库中最常用的10个函数(如果某些库常用函数不足10个,则列出所有常用函数)。每个函数都附带功能描述、用法说明和使用示例。这些库在数据科学、机器学习和数据可视化领域被广泛使用。

1. NumPy

  • 概述:NumPy 是 Python 中用于科学计算的基础库,提供多维数组对象和各种数学函数,支持高效的数值运算。

1.1 常用函数

  1. numpy.array()功能:创建一个 NumPy 数组。
    用法numpy.array(object, dtype=None)object 是输入数据(如列表、元组),dtype 是数据类型。
    示例

    import numpy as np
    data = [1, 2, 3, 4]
    arr = np.array(data)
    print(arr)  # 输出: [1 2 3 4]
    
  2. numpy.mean()
    功能:计算数组的平均值。
    用法numpy.mean(a, axis=None)a 是输入数组,axis 指定计算平均值的轴。
    示例

    import numpy as np
    arr = np.array([1, 2, 3, 4])
    avg = np.mean(arr)
    print(avg)  # 输出: 2.5
    
  3. numpy.sum()
    功能:计算数组元素的总和。
    用法numpy.sum(a, axis=None)a 是输入数组,axis 指定求和的轴。
    示例

    import numpy as np
    arr = np.array([1, 2, 3, 4])
    total = np.sum(arr)
    print(total)  # 输出: 10
    
  4. numpy.reshape()
    功能:改变数组的形状。
    用法numpy.reshape(a, newshape)a 是输入数组,newshape 是新的形状。
    示例

    import numpy as np
    arr = np.array([1, 2, 3, 4, 5, 6])
    reshaped = np.reshape(arr, (2, 3))
    print(reshaped)  # 输出: [[1 2 3] [4 5 6]]
    
  5. numpy.zeros()
    功能:创建一个全零数组。
    用法numpy.zeros(shape, dtype=float)shape 是数组形状,dtype 是数据类型。
    示例

    import numpy as np
    arr = np.zeros((2, 3))
    print(arr)  # 输出: [[0. 0. 0.] [0. 0. 0.]]
    
  6. numpy.ones()
    功能:创建一个全一数组。
    用法numpy.ones(shape, dtype=float)shape 是数组形状,dtype 是数据类型。
    示例

    import numpy as np
    arr = np.ones((2, 3))
    print(arr)  # 输出: [[1. 1. 1.] [1. 1. 1.]]
    
  7. numpy.random.rand()
    功能:生成均匀分布的随机数(0到1之间)。
    用法numpy.random.rand(d0, d1, ...)d0, d1, ... 是数组的维度。
    示例

    import numpy as np
    rand_arr = np.random.rand(2, 3)
    print(rand_arr)  # 输出: 2x3 的随机数数组
    
  8. numpy.std()
    功能:计算数组的标准差。
    用法numpy.std(a, axis=None)a 是输入数组,axis 指定计算标准差的轴。
    示例

    import numpy as np
    arr = np.array([1, 2, 3, 4])
    std_dev = np.std(arr)
    print(std_dev)  # 输出: 1.118033988749895
    
  9. numpy.max()
    功能:返回数组中的最大值。
    用法numpy.max(a, axis=None)a 是输入数组,axis 指定查找最大值的轴。
    示例

    import numpy as np
    arr = np.array([1, 2, 3, 4])
    max_val = np.max(arr)
    print(max_val)  # 输出: 4
    
  10. numpy.min()
    功能:返回数组中的最小值。
    用法numpy.min(a, axis=None)a 是输入数组,axis 指定查找最小值的轴。
    示例

    import numpy as np
    arr = np.array([1, 2, 3, 4])
    min_val = np.min(arr)
    print(min_val)  # 输出: 1
    

2. Pandas

  • 概述:Pandas 是一个强大的数据分析和操作库,提供 DataFrame 和 Series 数据结构,适用于数据清洗、分析和处理。

2.1 常用函数

  1. pandas.read_csv()
    功能:从 CSV 文件读取数据并创建 DataFrame。
    用法pandas.read_csv(filepath, delimiter=',')filepath 是文件路径,delimiter 是分隔符。
    示例

    import pandas as pd
    df = pd.read_csv('data.csv')
    print(df.head())  # 输出数据的前5行
    
  2. pandas.DataFrame.groupby()
    功能:按指定列对数据进行分组,并可应用聚合函数。
    用法DataFrame.groupby(by)by 是分组依据的列名。
    示例

    import pandas as pd
    data = {'Name': ['Alice', 'Bob', 'Alice'], 'Score': [85, 90, 88]}
    df = pd.DataFrame(data)
    grouped = df.groupby('Name').mean()
    print(grouped)  # 输出: 按Name分组的平均分
    
  3. pandas.DataFrame.describe()
    功能:生成数据的描述性统计信息(如均值、标准差)。
    用法DataFrame.describe()
    示例

    import pandas as pd
    data = {'Score': [85, 90, 88, 92]}
    df = pd.DataFrame(data)
    stats = df.describe()
    print(stats)  # 输出: Score列的统计信息
    
  4. pandas.DataFrame.fillna()
    功能:用指定值填充数据中的缺失值。

http://www.lryc.cn/news/2397965.html

相关文章:

  • 新德通科技:以创新驱动光通信一体化发展,赋能全球智能互联
  • Selenium的底层原理
  • PostgreSQL的扩展 auth_delay
  • [Java 基础]Java 是什么
  • Qt学习2
  • C++ 内存泄漏检测器设计
  • 在 Linux 上安装 Nmap 工具
  • 从零打造AI面试系统全栈开发
  • 破局与进阶:ueBIM 在国产 BIM 赛道的差距认知与创新实践
  • 分布式流处理与消息传递——向量时钟 (Vector Clocks) 算法详解
  • 20250603在荣品的PRO-RK3566开发板的Android13下的命令行查看RK3566的温度
  • 帝可得 - 设备管理
  • FTXUI配置
  • Caliper压力测试
  • 【iOS安全】使用LLDB调试iOS App | LLDB基本架构 | LLDB安装和配置
  • 一、核心概念深入解析
  • python直方图
  • [特殊字符] Unity 性能优化终极指南 — Text / TextMeshPro 组件篇
  • Idea 配置 Maven 环境
  • git clone报错:SSL certificate problem: unable to get local issuer certificate
  • Kafka 如何保证不重复消费
  • SpringBoot整合MyBatis完整实践指南
  • RNN结构扩展与改进:从简单循环网络到时间间隔网络的技术演进
  • docker中,容器时间和宿机主机时间不一致问题
  • Unity Shader编程】之高级纹理
  • 类 Excel 数据填报
  • vscode调试stm32,Cortex Debug的配置文件lanuch.json如何写,日志
  • Office文档图片批量导出工具
  • 【iOS】ARC 与 Autorelease
  • 人工智能在智能零售中的创新应用与未来趋势