当前位置: 首页 > news >正文

golang--字符串处理(rune类型)

在 Go 语言中,rune 类型是一个非常重要的基础类型,用于处理 Unicode 字符。以下是关于 rune 类型的详细用法说明:


一、基础概念

  1. 类型定义
    runeint32 的别名(type rune = int32),表示一个 Unicode 码点(Code Point)。

    var r rune = 'A'      // 等价于 int32(65)
    var emoji rune = '😊'  // Unicode 码点 U+1F60A
    
  2. byte 的区别

    • byteuint8 的别名,只能表示 ASCII 字符
    • rune 可表示所有 Unicode 字符(包括中文、emoji 等多字节字符)

二、核心用法

1. 字符串遍历

正确处理多字节字符:

s := "Hello, 世界!"// 错误方式:按字节遍历(会乱码)
for i := 0; i < len(s); i++ {fmt.Printf("%c", s[i]) // 输出:Hello, 世界!
}// 正确方式:按 rune 遍历
for _, r := range s {fmt.Printf("%c", r) // 输出:Hello, 世界!
}
2. 字符串与 []rune 转换
str := "Go语言"
runes := []rune(str)  // 转换为 rune 切片
fmt.Println(runes)     // [71 111 35821 35328]// 转换回字符串
newStr := string(runes)
fmt.Println(newStr)    // "Go语言"
3. 字符统计

获取实际的字符数量(而非字节数):

s := "🐶狗dog"
fmt.Println(len(s))          // 输出 9(字节数)
fmt.Println(len([]rune(s)))  // 输出 4(字符数)

三、常见应用场景

1. 字符串操作

字符串反转(正确处理 Unicode):

func ReverseString(s string) string {runes := []rune(s)for i, j := 0, len(runes)-1; i < j; i, j = i+1, j-1 {runes[i], runes[j] = runes[j], runes[i]}return string(runes)
}fmt.Println(ReverseString("Hello, 世界!")) // "!界世 ,olleH"

安全截取子串:

func SafeSubstr(s string, start, length int) string {runes := []rune(s)if start >= len(runes) {return ""}end := start + lengthif end > len(runes) {end = len(runes)}return string(runes[start:end])
}fmt.Println(SafeSubstr("Go语言很棒", 2, 2)) // "语言"
2. 字符验证

检查字符串是否只包含字母:

func IsAlpha(s string) bool {for _, r := range s {if !unicode.IsLetter(r) {return false}}return true
}fmt.Println(IsAlpha("Hello世界"))  // false
fmt.Println(IsAlpha("HelloWorld")) // true

四、注意事项

  1. 内存占用
    每个 rune 占 4 字节,处理纯 ASCII 文本时效率低于 byte

  2. 性能优化
    避免在循环中频繁转换 string[]rune

    // 错误方式(每次循环都转换)
    for i := 0; i < len(s); i++ {runes := []rune(s)// ...
    }// 正确方式(预先转换)
    runes := []rune(s)
    for i := 0; i < len(runes); i++ {// ...
    }
    
  3. 特殊字符处理
    使用 unicode 包处理复杂字符:

    r := 'ñ'
    fmt.Println(unicode.IsLetter(r))  // true
    fmt.Println(unicode.IsUpper(r))   // false
    fmt.Println(unicode.ToUpper(r))   // 'Ñ'
    

五、进阶用法

1. 自定义字符处理
// 移除字符串中所有非数字字符
func KeepNumbers(s string) string {var result []runefor _, r := range s {if unicode.IsNumber(r) {result = append(result, r)}}return string(result)
}fmt.Println(KeepNumbers("Tel: (123)456-789")) // "123456789"
2. 组合字符处理
import "golang.org/x/text/unicode/norm"func NormalizeString(s string) string {return norm.NFC.String(s)  // 将字符规范化为组合形式
}s := "caf\u00e9"        // "café"
fmt.Println(NormalizeString(s))

总结表格

场景推荐类型说明
处理 ASCII 文本byte内存效率更高
处理多语言文本rune支持所有 Unicode 字符
字符串遍历rune自动处理多字节字符
字符级操作rune安全进行反转、截取等操作
低内存环境byte减少内存占用(需确保纯 ASCII)

掌握 rune 的用法可以避免 Go 语言中常见的字符串处理错误,特别是在处理国际化场景时非常关键。

http://www.lryc.cn/news/540311.html

相关文章:

  • 如何通过AI优化敏捷开发中的任务管理与分配?
  • 第1章大型互联网公司的基础架构——1.11 消息中间件技术
  • FlutterAssetsGenerator插件的使用
  • EasyExcel 自定义头信息导出
  • 网络运维学习笔记 012网工初级(HCIA-Datacom与CCNA-EI)某机构新增:GRE隧道与EBGP实施
  • 【系列专栏】银行IT的云原生架构-存储架构-数据库部署 10
  • Python 爬虫selenium
  • 为啥vue3设计不直接用toRefs,而是reactive+toRefs
  • 深入解析 vLLM:高性能 LLM 服务框架的架构之美(二)调度管理
  • VMware安装教程
  • iOS事件传递和响应
  • TensorFlow 实现任意风格的快速风格转换
  • 火绒终端安全管理系统V2.0【系统防御功能】
  • 全志A133 android10 适配SLM770A 4G模块
  • 第3章 3.2 配置系统 .NET Core配置系统
  • 装修流程图: 装修前准备 → 设计阶段 → 施工阶段 → 安装阶段 → 收尾阶段 → 入住
  • Python----数据结构(单链表:节点,是否为空,长度,遍历,添加,删除,查找)
  • NLP-RNN-LSTM浅析
  • 【Cadence射频仿真学习笔记】Pcell Designer设计电感学习笔记
  • 臻识相机,华夏相机,芊熠车牌识别相机加密解密
  • 一个前端,如何同时联调多个后端
  • 向量的点乘的几何意义
  • 如何组织和管理JavaScript文件:最佳实践与策略
  • mysql实时同步到es
  • DeepSeek动画视频全攻略:从架构到本地部署
  • 第3章 3.3日志 .NET Core日志 NLog使用教程
  • R语言NIMBLE、Stan和INLA贝叶斯平滑及条件空间模型死亡率数据分析:提升疾病风险估计准确性...
  • Java 反射 (Reflection) 详解
  • 在 C++ 中,`QMessageBox_s::question_s2` 和 `app.question_s2` 的区别(由DS-V3生成)
  • vxe-grid 通过配置式给单元格字段格式化树结构数据,转换树结构节点