当前位置: 首页 > news >正文

R语言 | 进阶字符串的处理

目录

一、语句的分割

 二、修改字符串的大小写

 三、unique()函数的使用

 四、字符串的连接

4.1 使用paste()函数常见的失败案例1

4.2 使用paste()函数常见的失败案例2

4.3 字符串的成功连接与collapse参数

4.4 再谈paste()函数

4.5 扑克牌向量有趣的应用

五、字符串数据的顺序

六、查找字符串的内容

6.1 使用索引值搜索

​6.2 使用grep()函数搜索

七、字符串内容的更改

​编辑 八、正则表达式

8.1 搜索具有可选择性

8.2 搜索分类字符串

8.3 搜索部分字符可重复的字符串


一、语句的分割

在使用R语言时,常常需要将一段句子拆成单词,此时可以使用strsplit()函数。

 二、修改字符串的大小写

toupper():这个函数可以将字符串改成大写。

tolower():这个函数可以将字符串改成小写。

 三、unique()函数的使用

这个函数主要是让向量内容没有重复地出现。unique()函数可以让所有元素内容不重复出现。

 四、字符串的连接

4.1 使用paste()函数常见的失败案例1

上述实例使用paste()函数失败,最主要的原因是paste()函数内有c()函数,字符串经过c()函数处理后就会形成一个字符串向量。

4.2 使用paste()函数常见的失败案例2

 与上一个案例失败的原因相同。

4.3 字符串的成功连接与collapse参数

若是想用paste()函数成功将字符串向量内的字符串连接,需加上collapse参数。假设字符串是使用空格连接,则在paste()函数加上collapse=""参数即可。

将collapse参数设为NULL,与不加上此参数的结果相同。其实collapse参数除了NULL外,可以是任何其他字符,这个字符将是连接各个单字符的字符。

4.4 再谈paste()函数

其实paste()函数的主要目的是将两个或多个向量连接。

在连接的向量中,每个元素间以空格分开,如果我们不想让元素间有空格,可以在paste()函数内加上seq=" "参数。

 如果要连接的两个向量的长度(元素个数)不相同,R语言会使用重复机制,让较短的向量重复,直至与较长向量的长度相等。

4.5 扑克牌向量有趣的应用

五、字符串数据的顺序

sort()函数会为字符串向量的元素排序,默认是从小排到大,至于元素本身则不做排序。另外,decreasing参数默认是FALSE,如果设为TRUE,则排序是按由大排到小。

六、查找字符串的内容

6.1 使用索引值搜索

如果我们知道所要查找的字符串的索引值,那么可以使用substr()函数查找字符串。

6.2 使用grep()函数搜索

grep()函数是一个查找功能非常强大的函数。如果你去图书馆想找一本书,只知道Word 2013的书,却不知道完整书名,那么只输入“Word 2013”,系统即可搜索。这个函数的基本使用格式如下所示:

grep(pattern,x)

pattern:代表搜索的目标内容。

x:是字符串向量。

 如果在搜索时,找不到所搜索的内容,R语言将响应“character(0)”,表示是空的向量。

七、字符串内容的更改

sub()函数可以对搜索的字符串内容执行更改,这个函数的使用格式如下:

sub(pattern,replacement,x)

pattern:要搜索的字符串。

replacement:将要取代原字符串的字符串。

x:字符串向量。

 八、正则表达式

8.1 搜索具有可选择性

搜索具有可选择性,相当于具有or的特性,它的R语言语法是使用"|"符号,这个符号与"\"在同一个键盘按键上。

8.2 搜索分类字符串

可以使用"( )"符号搭配"|"符号,将所搜索的字符串分类。

8.3 搜索部分字符可重复的字符串

在搜索中可以添加"*"代表出现0次或多次,添加"+"代表出现1次或多次。

 

http://www.lryc.cn/news/63242.html

相关文章:

  • 【MySQL高级】——InnoDB索引MyISAM索引
  • 电影《灌篮高手》观后
  • C# .Net 中的同步上下文
  • 3分钟入门:Flex 布局
  • 我想知道,就目前形势而言,学java好还是C++好?
  • Mysql 管理
  • C#基础(算术运算符)
  • BM43-包含min函数的栈
  • [学习笔记] [机器学习] 3. KNN( K-近邻算法)及练习案例
  • React Hooks 钩子函数错误用法,你还在犯这些错误吗
  • tpm2-tools源码分析之tpm2_evictcontrol.c(1)
  • SpringCloud_OpenFeign服务调用和Resilience4J断路器
  • 【C++】switch 语句
  • 【Database-06】Centos 9 安装docker版的Oceanbase
  • TiDB Operator 和 Operator Dashboard
  • 计算机网络闲谈01——QUIC协议
  • 楼层滚动效果(超级简单,易懂)
  • FPGA、 CPU、GPU、ASIC区别
  • ChatGPT 之父承认 GPT-5 并不存在,为什么 OpenAI 总是这么实诚?|万字详述
  • 华为交换机配置telnet登录图文教程
  • Linux:网络基础1
  • Matlab对日期变量和时间变量的管理
  • js字符串 常用方法 并带详细讲解
  • Oracle_Audit_审计
  • python算法中的深度学习算法之生成对抗网络(详解)
  • 【VM服务管家】VM4.0软件使用_1.2 工具类
  • Android系统架构
  • 零基础想成为黑客,只需要四步
  • ChatGPT研究报告:AIGC带来新一轮范式转移
  • 自助式数据分析平台:jvs数据智仓-统计报表的使用条件及界面介绍