当前位置: 首页 > article >正文

String 学习总结

1. 存储机制

  • 短字符串优化(SSO, Small String Optimization)
    现代标准库中的字符串实现普遍采用 SSO 技术,将长度较短(例如 ≤15 字节)的字符串数据直接存储在字符串对象内部的固定缓冲区(栈上)。这样避免了频繁的堆内存分配,提高性能。

  • 堆内存存储
    当字符串长度超过内部缓冲区容量时,字符串数据会存储在堆上,通过指针引用。此时,字符串对象内保存的是指向堆内存的指针、当前长度和容量等元信息。


2. 重要属性

属性说明
size/length当前字符串实际使用的字符数
capacity当前分配的最大存储字符数(通常 ≥ size)
buffer指向字符串数据的指针,或者内部缓冲区(SSO时)
null terminatorC风格字符串中,以 '\0' 作为结束标志,std::string 内部通常会保证有一个多余空间存储该字符

3. 内存管理与容量策略

  • capacity 分配原则
    容量通常会大于当前字符串长度,目的是减少频繁的内存重新分配,提高追加操作效率。
    常见扩容策略:

    • 按固定比例扩容(如1.5倍、2倍)
    • 扩容到下一个合适的大小(例如2的幂次方)
  • 分配大小
    一般分配空间为 capacity + 1,多出的一字节用于存放 '\0',确保兼容 C 风格字符串操作。


4. 拷贝与赋值机制

4.1 深拷贝(Deep Copy)

  • 每次拷贝都会分配新的内存,并复制字符串内容,保证拷贝对象独立,安全但性能开销大。
  • 适用于早期设计和多线程环境。

4.2 共享内存 + 写时复制(Copy-On-Write, COW)

  • 多个字符串对象共享同一块数据内存。只有在某个对象试图修改数据时,才真正进行内存拷贝。
  • 可以减少内存使用,提升性能。
  • 缺点:需要维护引用计数,存在多线程安全风险。
  • 目前 C++11 及以后版本的标准库大多数已经废弃了 COW 机制,转为更简单且线程安全的设计。

5. 其他核心特性

5.1 移动语义支持(C++11 及以后)

  • 移动构造函数和移动赋值运算符,允许字符串的资源(内存指针)从一个对象转移到另一个对象,避免内存拷贝,显著提升性能。

5.2 不可变性 vs 可变性

  • C++ std::string 是可变的,允许修改字符串内容。
  • Java String 是不可变的,一旦创建,字符串内容不可更改,所有修改操作都会返回新的字符串对象。
  • 不同的设计影响内存管理和实现方式。

5.3 编码与字符宽度

  • std::string 本质是字节序列,默认按 ASCII 或 UTF-8 存储,字符数量和字节数不一定相等。
  • Unicode 相关的字符串类(如 std::u16string, std::wstring)处理多字节或宽字符,存储和访问更复杂。

5.4 线程安全

  • 标准库的字符串操作在多线程环境中通常不是完全线程安全的。
  • 多线程共享字符串时,需额外同步机制。

6. 常见面试问点总结

  • 你知道什么是 Small String Optimization 吗?它解决了什么问题?
  • 深拷贝和写时复制有什么区别?为什么现代库一般弃用写时复制?
  • 字符串的容量和长度有什么区别?为什么需要容量?
  • 讲讲 C++11 以后字符串的移动语义带来了哪些性能提升?
  • 字符串为什么需要以 ‘\0’ 结尾?是不是所有字符串都必须?
  • 如何避免字符串频繁的内存分配?
  • 你知道不同语言的字符串实现有什么不同吗?(可变 vs 不可变)
  • 多线程环境下字符串操作有哪些注意点?
http://www.lryc.cn/news/2397891.html

相关文章:

  • Python微积分可视化:从导数到积分的交互式教学工具
  • Juce实现Table自定义
  • 【25.06】fabric进行caliper测试加环境部署
  • 【后端高阶面经:架构篇】51、搜索引擎架构与排序算法:面试关键知识点全解析
  • Windows应用-音视频捕获
  • 【OCCT+ImGUI系列】012-Geom2d_AxisPlacement
  • 优化WP外贸建站提升用户体验
  • 【C++高并发内存池篇】性能卷王养成记:C++ 定长内存池,让内存分配快到飞起!
  • mac下通过anaconda安装Python
  • 第3篇:数据库路由模块设计与 SQL 路由策略解析
  • ARINC818编解码设计FPGA实现
  • 微软PowerBI考试 PL300-Power BI 入门
  • 逻辑回归知识点
  • YARN架构解析:大数据资源管理核心
  • 嵌入式学习笔记 - freeRTOS在程序开始在任务内创建任务的好处是什么
  • Ubuntu22.04 安装 CUDA12.8
  • Android的uid~package~pid的关系
  • 线段树刷题记录
  • 20250530-C#知识:万物之父Object
  • 多元素纳米颗粒:开启能源催化新纪元
  • 分布式锁优化:使用Lua脚本保证释放锁的原子性问题
  • 电脑wifi显示已禁用怎么点都无法启用
  • 【FPGA开发】Ubuntu16.04环境下配置Vivado2018.3—附软件包
  • vue-seamless-scroll 结束从头开始,加延时后滚动
  • 不同的数据库操作方式:MongoDB(NoSQL)和 MySQL/SQL
  • 0-EATSA-GNN:基于图节点分类师生机制的边缘感知和两阶段注意力增强图神经网络(code)
  • 大数据学习(124)-spark数据倾斜
  • 配置前端控制器
  • lua注意事项
  • Git的三种合并方式