当前位置: 首页 > news >正文

Pandas数据分析教程-数据清洗-字符串处理

pandas-02-数据清洗&预处理

  • D. 字符串处理
    • 1. Python自带的字符串处理函数
    • 2. 正则表达式
    • 3. Series的str属性-pandas的字符串函数

文中用S代指Series,用Df代指DataFrame
数据清洗是处理大型复杂情况数据必不可少的步骤,这里总结一些数据清洗的常用方法:包括缺失值、重复值、异常值处理,数据类型统计,分箱,随机采样,向量化编码等方法。每种方法都给出了代码和实例,并用表格进行总结。

D. 字符串处理

1. Python自带的字符串处理函数

  • string.split(‘,’) 用指定的分隔符分割字符串
  • string.strip() 去掉空格,换行符
  • ‘::’.join(string)
  • ‘,’ in string 用于判断 ‘,’ 是否在字符串内
  • string.index(‘,’) 返回第一个找到的‘,’的索引,若未找到将会报错
  • string.find(‘,’) 返回第一个找到的‘,’的索引,若未找到将会返回 -1
  • string.count(‘,’) 返回不重叠的个数
  • string.replace(‘,’,’ ‘) 使用空格替换‘,’
s 
http://www.lryc.cn/news/141332.html

相关文章:

  • Nginx 核心配置
  • yum命令安装程序
  • 什么是CSS中的BFC?
  • 探讨uniapp的页面问题
  • 【跨域异常】
  • 上市公司环境信息披露(含环境负债、管理、监管、业绩与治理披露,2008-2022)
  • 网络基础入门
  • Oracle工具之SQLLDR
  • 探索pytest:Python自动化测试的新境界
  • K8s学习笔记4
  • Kafka 学习笔记
  • vue实现表格的动态高度
  • HodlSoftware-免费在线PDF工具箱 加解密PDF 集成隐私保护功能
  • 09 数据库开发-MySQL
  • QT通过ODBC连接GBase 8s数据库(Windows)示例
  • Java-三个算法冒泡-选择排序,二分查找
  • docker版jxTMS使用指南:使用jxTMS提供数据
  • 阿里 MySQL 规范
  • C++ Primer阅读笔记--动态内存和智能指针
  • git分支管理策略
  • IntelliJ IDEA maven配置,设置pom.xml的配置文件
  • C#__使用Thread启动线程和传输数据
  • appium2.0+ 单点触控和多点触控新的解决方案
  • 记录一次Modbus通信的置位错误
  • 数据结构--递归与分治
  • spring cloud gateway中出现503
  • 战略在集体学习过程中涌现
  • html动态爱心代码【四】(附源码)
  • 如何利用SLF4J扩展模块实现高效的日志记录
  • 通用语言模型蒸馏-GLMD