当前位置: 首页 > news >正文

GO 中高效 int 转换 string 的方法与高性能源码剖析


文章目录

    • 使用 `strconv.Itoa`
    • 使用 `fmt.Sprintf`
    • 使用 `strconv.FormatInt`
    • FormatInt 深入剖析
      • 1. 快速路径处理小整数
      • 2. formatBits 函数的高效实现
    • 结论

Go 语言 中,将整数(int)转换为字符串(string)是一项常见的操作。

本文将从逐步介绍几种在 Go 中将 int 转换为 string 的常见方法,并重点剖析这几种方法在性能上的特点。另外,还会重点介绍 FormatInt 高效的算法实现。

在这里插入图片描述

使用 strconv.Itoa

最直接且常用的方法是使用 strconv 包中的 Itoa 函数。Itoa 是 “Integer to ASCII” 的简写,它提供了一种快速且简洁的方式实现整数到字符串之间的转换。

示例代码如下:

package mainimport ("strconv""fmt"
)func main() {i := 123s := strconv.Itoa(i)fmt.Println(s)
}

strconv.Itoa 是通过直接将整数转换为其 ASCII 字符串表示形式。这个过程中尽量减少了额外的内存分配,没有复杂逻辑。

使用 fmt.Sprintf

另一种方法是,使用 fmt 包的 Sprintf 函数。这个方法在功能上更为强大和灵活,因为它能处理各种类型并按照指定的格式输出。

示例代码如下:

package mainimport ("fmt"
)func main() {i := 123s := fmt.Sprintf("%d", i)fmt.Println(s)
}

虽然 fmt.Sprintf 在功能上非常强大,但它的性能通常不如 strconv.Itoa

为什么呢?

因为 fmt.Sprintf 内部使用了反射(reflection)确定输入值类型,并且在处理过程中涉及到更多的字符串拼接和内存分配。

使用 strconv.FormatInt

当需要更多控制或处理非 int 类型的整数(如 int64)时,可以使用 strconv 包的 FormatInt 函数。

package mainimport ("strconv""fmt"
)func main() {var i int64 = 123s := strconv.FormatInt(i, 10)  // 10 表示十进制fmt.Println(s)
}

strconv.FormatInt 提供了对整数转换过程的更细粒度控制,包括 base 的选择(例如,十进制、十六进制等)。

strconv.Itoa 类似,FormatInt 在性能上也非常可观,而且 FormatInt 提供了既灵活又高效的解决方案。

如果我们查看 strconv.Itoa 源码,会发现 strconv.Itoa 其实是 strconv.FormatInt 的一个特殊情况。

// Itoa is shorthand for FormatInt(int64(i), 10).
func Itoa(i int) string {return FormatInt(int64(i), 10)
}

现在 int 转 string 的高性能源码剖析,就变成了重点剖析 FormatInt

FormatInt 深入剖析

基于 Go 1.21 版本的 itoa.go 源码,我们可以深入理解 strconv 包中整数到字符串转换函数的高效实现。

func FormatInt(i int64, base int) string {if fastSmalls && 0 <= i && i < nSmalls && base == 10 {return small(int(i)) // 100 以内的十进制小整数,使用 small 函数转化}_, s := formatBits(nil, uint64(i), base, i < 0, false) // 其他情况使用 formatBitsreturn s
}

以下是对其核心部分的详细解读,将会突出了其性能优化的关键方面,结合具体的源码实现说明。

在这里插入图片描述

1. 快速路径处理小整数

对于常见的小整数,strconv 包提供了一个快速路径,small 函数,直接返回预先计算好的字符串,避免了运行时的计算开销。

func small(i int) string {if i < 10 {return digits[i : i+1]}return smallsString[i*2 : i*2+2]
}

对于小于 100 的十进制整数,采用这个快速实现方案,或许这也是整数转字符串的最常见使用场景吧。

small 函数通过索引到 smallsStringdigits 获取小整数的字符串表示,这个过程非常快速。

digitssmallsString 的值,如下所示:

const smallsString = "00010203040506070809" +"10111213141516171819" +"20212223242526272829" +"30313233343536373839" +"40414243444546474849" +"50515253545556575859" +"60616263646566676869" +"70717273747576777879" +"80818283848586878889" +"90919293949596979899"const digits = "0123456789abcdefghijklmnopqrstuvwxyz"

它们也就是十进制 0-99 与对应字符串的映射。

2. formatBits 函数的高效实现

FormatInt 最复杂的部分是 formatBits 函数,它是整数到字符串转换的核心,它针对不同的基数进行了优化。

在这里插入图片描述

10进制转换的优化

对于10进制转换,formatBits 使用了基于除法和取余的算法,并通过 smallsString 加速两位数的字符串获取。

if base == 10 {// ... (32位系统的优化)us := uint(u)for us >= 100 {is := us % 100 * 2us /= 100i -= 2a[i+1] = smallsString[is+1]a[i+0] = smallsString[is+0]}// ... (处理剩余的数字)
}
  • 对于 32 位系统,使用32位操作处理较大的数字,减少 64 位除法的开销。
  • 每次处理两位数字,直接从 smallsString 获取对应的字符,避免了单独转换每一位的开销。

2的幂基数的优化

对于基数是2的幂的情况,formatBits 使用了位操作来优化转换。

} else if isPowerOfTwo(base) {shift := uint(bits.TrailingZeros(uint(base))) & 7b := uint64(base)m := uint(base) - 1 // == 1<<shift - 1for u >= b {i--a[i] = digits[uint(u)&m]u >>= shift}// u < basei--a[i] = digits[uint(u)]
}
  • 位操作是直接在二进制上进行,比除法和取余操作更快。
  • 利用 2 的幂基数的特性,通过移位和掩码操作获取数字的各个位。

通用情况的处理

对于其他基数,formatBits 使用了通用的算法,但仍然尽量减少了除法和取余操作的使用。

} else {// general caseb := uint64(base)for u >= b {i--// Avoid using r = a%b in addition to q = a/b// since 64bit division and modulo operations// are calculated by runtime functions on 32bit machines.q := u / ba[i] = digits[uint(u-q*b)]u = q
}

我觉得最核心的算法就是利用移位和特殊路径预置映射关系。另外,由于算法足够优秀,还避免了一些不必要内存分配。

结论

将 int 转化为 string 是一个非常常见的需求。Go 语言的 strconv 包中的 int 到 string 的转换函数展示了 Go 标准库对性能的深刻理解和关注。

通过快速处理小整数、优化的 10 进制转换算法、以及2^n 基数的特别处理,这些函数能够提供高效且稳定的性能。这些优化确保了即使在大量数据或在性能敏感的场景中,strconv 包的函数也能提供出色的性能

博文地址:GO 中高效 int 转换 string 的方法与源码剖析

http://www.lryc.cn/news/286991.html

相关文章:

  • YOLOv7调用摄像头检测报错解决
  • Git学习 -- 分支合并、版本修改相关
  • 【小呆的力学笔记】弹塑性力学的初步认知二:应力应变分析(2)
  • 【学网攻】 第(6)节 -- 三层交换机实现VLAN间路由
  • C++之内联函数
  • 【Bugku-web】alert
  • QQ数据包解密
  • 腾讯云上linux系统使用nginx,flask构建个人网站SSL证书过期换证书的操作步骤
  • git-clone的single-branch操作回退
  • 03 SpringBoot实战 -微头条之首页门户模块(跳转某页面自动展示所有信息+根据hid查询文章全文并用乐观锁修改阅读量)
  • YOCTO基础 - 创建meta层与bb文件
  • 网络电视盒子哪个好?博主分享超高性价比网络电视盒子推荐
  • leetcode 刷题2
  • 2-SAT问题相关理论和算法
  • 【大数据精讲】全量同步与CDC增量同步方案对比
  • 自定义通用返回对象
  • 从0开始python学习-51.pytest之接口加密封装
  • c++的命名空间
  • 阿富汗塔利班兴起时的比赛代码3475:练85.3 删数问题(Noip1994)
  • 大数据平台红蓝对抗 - 磨利刃,淬精兵!
  • 【2024-01-22】某极验3流程分析-滑块验证码
  • Laya2.13.3接入FGUI
  • 短视频账号矩阵系统+无人直播系统源码技术开发
  • C语言或C++通过IShellLinkA创建或解析lnk快捷方式(使用char字符数组)
  • Spring源码学习-Spring流程概述(一)
  • Figma怎么设置中文,Figma有中文版吗?
  • 智慧文旅一机游:科技与文化的完美结合,引领智慧文旅新潮流,智慧旅游未来已来
  • 多维时序 | Matlab实现CNN-LSTM-Mutilhead-Attention卷积长短期记忆神经网络融合多头注意力机制多变量时间序列预测
  • 软件工程实验报告(完整)
  • Java零基础学习20:集合的练习