当前位置: 首页 > news >正文

C++——vector:resize与reserve的区别,验证写入4GB大数据时相比原生操作的效率提升

resize和reserve的区别

reserve:预留空间,但不实例化元素对象。所以在没有添加新的对象之前,不能引用容器内的元素。而要通过调用push_back或者insert。

resize:改变容器元素的数量,且会实例化对象(指定或默认0)。因此,调用resize之后,可以直接引用容器内的对象。此时再调用push_back,是加在这个新的空间后面,即size之后的。同样也会触发push_back()的空间预留机制。

如果newSize < size,则该容器后部的元素会被析构,且resize可能会使迭代器失效,对于所有的容器类型,如果resize操作压缩了容器,则指向已删除的元素的迭代器失效。同样的,扩容也可能导致迭代器失效,因为原来迭代器指向的位置的内存已经被释放,因为内存被移动到了别的位置。比如如果count大于size,则会扩容,如果后续空间不够,需要寻找一块足够的空间,然后把元素逐个复制过去。

当元素写入不超过预留空间时,reserve()不涉及内存的重新分配,resize()会涉及内存的重新分配。
reserve()只修改capacity大小,不修改size大小,resize()既修改capacity大小,也修改size大小。
如果reserve和resize的newSize大于capacity,都会涉及内存分配。

申请和写入大内存时三者的差异

以下的代码示例是在Linux平台下运行的。

void test_reserve()
{clock_t start = clock();std::vector<int> arr1;arr1.reserve(1000000000);/* 10^9 * 4 / 1024 / 1024 = 3814MB */for(int i = 0; i < 1000000000; i++){arr1.push_back(i);}std::cout <<"耗时:"<< (clock() - start) << std::endl;std::cout <<"size:"<< arr1.size() << " capacity:" << arr1.capacity() << std::endl;/*耗时:13.52 秒size:1000000000 capacity:1000000000*/
}void test_resize()
{clock_t start = clock();std::vector<int> arr1;arr1.resize(1000000000);/* 10^9 * 4 / 1024 / 1024 = 3814MB */for(int i = 0; i < 1000000000; i++){arr1[i] = i;}std::cout <<"耗时:"<< (clock() - start) << std::endl;std::cout <<"size:"<< arr1.size() << " capacity:" << arr1.capacity() << std::endl;/*耗时:6.39秒size:1000000000 capacity:1000000000*/
}class test
{public:test() {std::cout << "构造" << std::endl; }~test() {std::cout << "析构" << std::endl; }
};int main()
{clock_t start = clock();std::vector<int> arr;/* 10^9 * 4 / 1024 / 1024 = 3814MB */for(int i = 0; i < 1000000000; i++){arr.push_back(i);}std::cout <<"耗时:"<< (clock() - start) << std::endl;std::cout <<"size:"<< arr.size() << " capacity:" << arr.capacity() << std::endl;/*耗时:18.68 秒size:1000000000 capacity:1073741824*/test_reserve();test_resize();return 0;
}

可以看到,reserve相比原生操作快了5秒,而resize后直接通过下标写入,比原生快了12秒,提升还是很可观的。但是前提是要知道元素的个数。
在进程运行的过程中,可以通过shell脚本实时查看进程的内存占用。
这个脚本的意思是:死循环,提取ps aux指令的第一行,即各种参数的标题,并且再提取a.out即程序名的各项信息,之后打印换行,睡眠1秒。达到每隔一秒监控一次内存占用的效果。

while true; 
do ps aux | head -1 ; ps aux | grep a.out; 
printf "————————————————————————————————————————————\n\n" ; sleep 1; 
done

在这里插入图片描述
上图是使用reserve的情况,可以看到VSZ即虚拟内存在调用reserve之后就飙到了4GB,因为Linux是内存延时分配的,即使用了该内存空间才实际分配物理内存。又因为vector的扩容方式是1.5倍扩容,因此可以看到,在push_back的过程中RSS即实际物理内存是逐渐上升的。

在这里插入图片描述
而上图是使用resize的情况,因为resize是实际分配了空间并会实例化元素的,因此物理内存占用上升的非常快,几乎几秒就占满了4GB。

http://www.lryc.cn/news/158101.html

相关文章:

  • 基础配置xml
  • win环境安装SuperMap iserver和配置许可
  • 【Apollo学习笔记】——规划模块TASK之PIECEWISE_JERK_NONLINEAR_SPEED_OPTIMIZER(一)
  • pytest parametrize多参数接口请求及展示中文响应数据
  • 电视连续剧 ffmpeg 批量去掉片头片尾
  • 二进制搭建kubernetes
  • TDengine函数大全-系统函数
  • 北京互联网营销服务商浩希数字科技申请1350万美元纳斯达克IPO上市
  • ElementUI浅尝辄止22:Alert 警告
  • HCIP的mgre实验
  • redis cluster集群搭建
  • 小红书笔记爬虫
  • 国密GmSSL v2版本命令行方式生成国密sm2私钥、公钥、签名和验证签名
  • 2023年9月惠州/深圳CPDA数据分析师认证找弘博创新
  • it运维监控管理平台,统一运维监控管理平台
  • TDengine 官网换了新“皮肤”,来看看这个风格是不是你的菜
  • MFC:自绘CListBox,GetText返回一个乱码
  • shell 脚本发布前后端代码
  • 我的私人笔记(Linux中安装mysql)
  • IDEA版SSM入门到实战(Maven+MyBatis+Spring+SpringMVC) -Maven目录结构和idea的整合
  • Android Automotive概述
  • iOS 16.4更新指南:问题解答与新功能一览
  • Vue + Element UI 前端篇(八):管理应用状态
  • 开发常用代码区
  • SpringBoot+MySQL+Vue前后端分离的宠物领养救助管理系统(附论文)
  • ClickHouse 存算分离改造:小红书自研云原生数据仓库实践
  • STM32-DMA
  • 1065 A+B and C (64bit)
  • 阿里云效和阿里在线idea使用
  • [git] 删除分支中的内容 -> 空分支