当前位置: 首页 > news >正文

【Python】Python 连接字符串应优先使用 join 而不是 +

Python 连接字符串应优先使用 join 而不是 +

简介

字符串处理在大多数编程程序语言中都不可避免,字符串的连接也是在编程过程中经常需要面对的问题。 Python中的字符串与其他一些程序语言如C++、Java有一些不同,它为不 可变对象。 一旦创建便不能改变,它的这个特性直接影响到Python中字符串连接的效率。 我们首先来看常见的两种字符串连接方法。

使用操作符+连接字符串的方法如下:

strl, str2, str3 =“testing”, “string”,“concatenation”
strl + str2 + str3
‘testingstringconcatenation’
3.9.2. 使用join方法连接字符串的方法如下:
‘’.join ([strl, str2, str3])
‘testingstringconcatenation’
思考这么一个问题:上述两种字符串连接的方法除了使用形式上的不同还有其他区别 呜?性能上会不会有所差异呢?来看下面这个测试例子:

import timeit

#生成埘试所雋要的字符數组

strlist=[“it is a long value string will not keep in memory” for n in range(100000)]

def join_test():
#使用join方法连接strlist中的元#并返回字符串
return ’ ’ . join (strlist)
def plus_test():
result =“”
for i,v in enumerate(strlist):
#使用*进行宇符串连接
result=(result + v)
return result
现在开始测试:

jointimer = timeit.Timer(“join_test()” ,“from main import join_test”)
print (jointimer.timeit(number = 100))
0.11032061399964732
第二种方式:

plustimer = timeit.Timer (“plus_test()”,“from main import plus_test”)
print( plustimer.timeit(number = 100))
1.025606508999772
给上曲的程序传入一组测试参数(测试参数为3, 10,100,1000,10000, 100000; 分 别表示每一次测试所要连接的字符串的数量X程序用于测试 join_test() 和 plus_test() 这两个方法在宇符串连接规模改变时所消耗时间的变化。

测试结果记录如表所示

_images/27-1.png
下图所示的X.Y图表示,其中X轴表示所要连接的字符串的数量,Y轴 表示消耗的时间

_images/27-2.png
从分析测试结果图表我们不难发现:分别使用join方法和使用+操作符来连接字符串. join()方法的效率要高于+操作符,特別是字符串规模较大的时候,join()方法的优势更为明显(如连接数为100000的时候,两者耗时相差上百倍)。造成这种差别的原因在哪里呢?我们来探讨一下。当用操作符+连接字符串的时候.由于字符串是不可变对象.其工作原理实际上是这样的:如果要连接如下字符串:S1+S2+S3+…….+SN,执行一次+操作便会在内存中申请一块新的内存空间,并将上一次操 作的结果和本次操作的右操作数复制到新 申请的内存空间,即当执行SI+S2的时候 会申请一块内存,并将SI、S2复制到该内 存屮.依次类推,如图

_images/27-3.png
因此.在 N个字符串连接的过程中,会产生N-I个 中间结果,每产生一个中间结果都需要申 请和复制一次内存,总共需要申请N-1次 内存,从而严童影响了执行效率。N越大,

对内存的申请和复制的次数越多,+操作符的效率就越低。因此.整个字符连接的过程中, 相当于S1被复制N-1次,S2被复制N-2次….SN复制1次(并不完全等同于S1复制N-1 次,因为后续复制都是对中间结果的复制所以字符串的连接时间复杂度近似为O(n^2)。 而当用 join() 方法连接字符串请的总的内存空间,然后一次 性申请所需内存并将字符序列中的每一个元素复制到内存中去, 所以 join 操作的时间复杂度 为 O(n)

因此,宇符串的连接,特别是大规模字符串的处理,应该尽量优先使用 join 而不是 + 。

http://www.lryc.cn/news/169255.html

相关文章:

  • uniapp 小程序 父组件调用子组件方法
  • Vue-01:MVVM数据双向绑定与Vue的生命周期
  • 数据通信网络之OSPFv3基础
  • FPGA-结合协议时序实现UART收发器(五):串口顶层模块UART_TOP、例化PLL、UART_FIFO、uart_drive
  • 我学编程全靠B站了,真香-国外篇(第三期)
  • c++ 变量常量指针练习题
  • Linux底层基础知识
  • JUC并发编程--------线程安全篇
  • 机器视觉之Basler工业相机使用和配置方法(C++)
  • Centos nginx配置文档
  • 2023/9/14 -- C++/QT
  • golang在goland编译时获取环境变量失效
  • 一款非常容易上手的报表工具,简单操作实现BI炫酷界面数据展示,驱动支持众多不同类型的数据库,可视化神器,免开源了
  • 蓝桥杯 题库 简单 每日十题 day3
  • 基于SSM+Vue的高校实验室管理系统的设计与实现
  • C语言天花板——指针(初阶)
  • 关于第一届全球电子纸创新应用金奖征集评选及报名指南
  • idea搭建项目找不到Tomcat
  • 类和对象三大特性之继承
  • Debian 12安装Docker
  • 小谈设计模式(4)—单一职责原则
  • ATF(TF-A) EL3 SPMC威胁模型-安全检测与评估
  • AI绘画Stable Diffusion原理之扩散模型DDPM
  • NSS [西湖论剑 2022]real_ez_node
  • MySQL常用函数集锦 --- 字符串|数值|日期|流程函数总结
  • GaussDB(DWS)云原生数仓技术解析:湖仓一体,体验与大数据互联互通
  • Navicat历史版本下载及地址组成分析
  • avue之动态切换表格样式问题
  • 彻底解决ruoyi分页后总数错误的问题
  • SpringMVC学习笔记——1