C++之string类的实现代码及其详解(中)
1. string的接口函数代码实现
string本身的设计并不难实现,对于初学者来说难的是他的一些接口函数,接下来我们把一些常用的接口函数实现一下。
1.1 c_str()
这个函数用于返回指向以空字符开头的C风格字符串的指针。这个函数允许string
对象与C风格字符串进行交互。
在下面这个代码里面第一个const表示函数返回的是一个指向常量的指针,即不能通过该指针修改所指向的内容,而第二个const
表示这个函数是一个常量成员函数,意味着它可以被常量对象调用,且在函数内部不能修改类的非静态成员变量。即前者不能改变指向,后者不能改变被指向的内容。
const char* c_str() const
{return _str;
}
1.2 size()和capacity()
这两个不用多说,一个是求这个string类型的字符串的size,一个是求这个字符串的capacity。
这两个是不一样的,简单来说就是一桶水,size是现在有多少水,capacity是桶的大小。
PS:在后面加const也是说明内容不可修改。
size_t size() const
{return _size;
}size_t capacity() const
{return _capacity;
}
1.3 reserve()
reserve(x)就是让这个string类型的字符串的capacity变为x大小(前提是x比capacity大)。
我这边代码就是通过开辟新空间,然后把旧的_str内容memcpy(也就是复制)给tmp,接着把_st所指向的内容给delete了,最后把tmp给_str并且把capacity的大小改为n。
void reserve(size_t n)
{if (n > _capacity){char* tmp = new char[n + 2];memcpy(tmp, _str, _size+1);delete[] _str;_str = tmp;_capacity = n;}
}
1.4 push_back()
这个函数就是一个简单的插入,同时函数线检测size和capacity是否已经相等,如果已经相等那就使用reserve对其进行扩容(所以三目运算符是为了防止capacity为0的情况)。又因为size是最后一个的下一个,所以直接_str[_size] = ch,同时++size然后放上\0。
void push_back(char ch)
{if (_size == _capacity){reserve(_capacity == 0 ? 4 : _capacity * 2);}_str[_size] = ch;++_size;_str[_size] = '\0';
}
1.5 append()
append
用于在字符串的末尾添加字符或字符串。
PS:我们在这里要和上面的push_back做区分,push_back适合一个一个添加字符,而append适合一口气添加多个字符(我们可以理解为字符的拼接)。
计算源字符串长度,若当前容量不足则调用reserve
扩容至_size + len + 1
以容纳新内容。随后使用memcpy
将源字符串(含终止符)复制到原字符串末尾。
void append(const char* str)
{size_t len = strlen(str);if (_size + len > _capacity){reserve(_size+len+1);}memcpy(_str + _size, str, len);_size += len;
}
1.6 erase()
简单来说,这个函数就是给一个要开始删除的位置pos和一个要从这个位置开始删除的长度,然后就会执行删除操作。如果失败(即pos比size还要后面)就assert。
PS:这个npos的意思就是说这个参数可以不填,如果不填的话就是删除从pos开始往后面的所有。
if就是说如果要删除的位置比size还要后面的话,那就直接在pos的位置上放上一个\0,通过这样的方式来表示删除,else就是说明是删除pos到size的一段,通过while循环的方式把后面的内容填到前面,然后size减去len。
PS:在if条件里面的删除并不是真的把东西删了,而是采用了一种类似于stream的方式,即当做后面的东西不存在。
PS:我们在这里不用加上\0,因为我们已经把size位置的\0移动到前面来了。
void erase(size_t pos, size_t len = npos)
{assert(pos <= _size);if (len == npos || pos + len >= _size){_str[pos] = '\0';_size = pos;//_str[_size] = '\0';}else{size_t end = pos + len;while (end <= _size){_str[pos++] = _str[end++];}_size -= len;}
}
1.7 find()
find就如同它的字面意思一样用于查找字符串里面的字符或者字符串,如果找到了那就返回那个字符的位置。我们在这里使用size_t的原因是防止超过 INT_MAX
时会溢出。
PS:在这里pos是是开始查找的开始位置。举个例子,
假设字符串是"hello world"(索引0-10):
1. 从开头找'l':
find('l') → 从索引0开始,找到第一个'l'在索引2,返回2。
2. 从索引6开始找'l':
find('l', 6) → 跳过前6个字符("hello "),从'w'(索引6)开始找,找到第二个'l'在索引9,返回9。
这个代码很好理解,就是通过从pos的位置开始查找的方式来返回第一个找到的字符的位置。
size_t find(char ch, size_t pos = 0)
{assert(pos <= _size);for (size_t i = pos; i <= _size; ++i){if (_str[i] == ch){return i;}}return npos;
}
1.8 resize()
这个函数的作用就是减小或者变大字符串的长度,若 n < 原长度,字符串会(变小截断),若 n > 原长度,字符串会变大(扩展,用ch填充新增部分)。
PS:这里要注意,变小是不会改变内容的,变大才会添加内容。
当新长度n
小于当前长度时,直接将长度截断为n
并在新末尾添加终止符'\0'
;当n
大于当前长度时,先调用reserve(n)
确保容量足够,然后从原长度位置开始用字符ch
(默认'\0'
)填充至n
位置,最后更新长度为n
并添加终止符。该实现确保了字符串始终以'\0'
结尾,且扩展时自动扩容并填充指定字符。
void resize(size_t n, char ch = '\0')
{if (n < _size){_size = n;_str[_size] = '\0';}else{reserve(n);for (size_t i = _size; i < n; i++){_str[i] = ch;}_size = n;_str[_size] = '\0';}
}