C++之打造my vector篇

发布于:2024-09-18 ⋅ 阅读:(68) ⋅ 点赞:(0)

目录

前言

1.参照官版,打造vector的基本框架

2.丰富框架,实现接口方法

基本的迭代器实现

数据的[]访问

容量和数据空间的改变

vector空间大小的返回与判空

数据的增删

数据打印

拷贝构造和赋值重载

3.扩展延伸,深度理解代码

迭代器失效问题

使用memcpy的拷贝问题

结束语


前言

前面章节我们讲解了vector相关接口,方法的使用,本节内容我们将自己创造vector,模仿官方的接口方法。

1.参照官版,打造vector的基本框架

通过查看官方文档我们知道,vector是个可以变化的数组,是个容器,可以储存一系列数据,

是典型的模版类。

且有三个基本成员start,finish,end_of_storage,我们可以理解为指向数组的开端,数据的结尾,以及容量的结束指针。

上图为插入成员后的分布情况。

故创造了一下的基本框架,因为是我们自己的实现,所以定义了一个my_vector的命名空间,

namespace my_vector {
	template<class T>
	class vector {
	public:
		typedef T* iterator;
		typedef const T* const_iterator;
		vector() 
		{}

   ~vector() {
	if (_start) {
		delete[]_start;
		_start = _finish = _end_of_storage = nullptr;
	}
}
private:
	iterator _start = nullptr;
	iterator _finish=nullptr;
	iterator _end_of_storage=nullptr;
};

这里我们采用初始化列表来进行默认构造,直接使用私有成员的缺省值,较为简便。

C++11前置生成默认构造

vector()=default;

2.丰富框架,实现接口方法

基本的迭代器实现

iterator begin() {
	return _start;
}
iterator end() {
	return _finish;
}
const_iterator begin()const {
	return _start;
}
const_iterator end() const{
	return _finish;
}

就是比较简单的返回开始和结束的指针。

数据的[]访问

T& operator[](size_t i) {
	assert(i < size());
	return _start[i];
}
const T& operator[](size_t i) const
{
	assert(i < size());

	return _start[i];
}

顾名思义就是相似于数组的下标访问

容量和数据空间的改变

void reserve(size_t n) {
	if (n > capacity()) {
		size_t oldsize = size();
		T* temp = new T[n];
       memcpy(tmp, _start, old_size * sizeof(T));
/*
		for (size_t i = 0; i < oldsize; i++) {
			temp[i] = _start[i];
		}
*/
		delete[]_start;
		_start = temp;
		_finish =temp + oldsize;
		_end_of_storage = temp+n;
	}
}

对于扩容操作,我们创建了一个新的数组,然后定义一个oldsize来存储以前的数据空间,来确定之后的_finish位置,因为我们在之前释放了原来的数组了,如果不想这样操作,不想定义一个oldsize,就要把delete操作放在_finish=temp+size()之后。

这里用了memcpy函数来转移数据,但是我们会发现有一个小小的问题,当数据类型为string时,程序会崩溃,这个后续会讲解的。

void resize(size_t n, T val = T())
		{
			if (n < size())
			{
				_finish = _start + n;
			}
			else
			{
				reserve(n);
				while (_finish < _start + n)
				{
					*_finish = val;
					++_finish;
				}
			}
		}

resize函数的作用是调整容器的大小,使其能够容纳n个元素。如果n小于当前容器的大小,则容器会被截断;如果n大于当前容器的大小,则容器会被扩展,并且新增的元素会被初始化为val的值。

T val = T():表示一个默认参数,它是容器的元素类型T的默认构造函数生成的对象。如果调用resize时没有指定这个参数,就会使用元素类型的默认值。

如果n小于当前容器的大小
_finish = _start + n;:这条语句会截断容器,使其大小变为n。这里_start是指向容器第一个元素的指针,_finish是指向容器最后一个元素的下一个位置的指针。通过将`_finish`向前移动到_start + n的位置,容器的大小就被减少了。
 如果`n`大于或等于当前容器的大小
- reserve(n);:调用reserve函数确保容器的容量至少为n。如果当前容量小于n,reserve会重新分配内存以容纳至少n个元素。
- 默认构造函数`T()`必须存在,以便能够为新元素提供默认值。如果`T`没有默认构造函数,则这段代码在尝试使用默认参数时会出错。

vector空间大小的返回与判空

size_t size()const {
	return _finish - _start;
}
size_t capacity()const {
	return _end_of_storage - _start;
}
bool empty()const {
	return _start == _finish;
}

大小返回就是几个指针加减即可

数据的增删

对于数据的增删,模拟尾插,尾删,指定位置的插入,删除(后两者都与迭代器iterator相结合)

void push_back(const T& x) {
	if (_finish == _end_of_storage) {
		reserve(capacity() == 0 ? 4 : capacity() * 2);
	}
	*_finish = x;
	++_finish;
}
void pop_back() {
	assert(!empty());
	--_finish;
}
void erase(iterator pos) {
	assert(pos >= _start);
	assert(pos <= _finish);
	iterator it = pos + 1;
	while (it != end()) {
		*(it - 1) = *it;
		it++;
	}
	_finish--;
}
iterator insert(iterator pos,const T&x) {
	assert(pos >= _start  && pos<=_finish);
	if (_finish == _end_of_storage) {
		size_t len = pos - _start;
		reserve(capacity() == 0 ? 4 : capacity() * 2);
		pos = _start + len;
	}
	iterator end = _finish + 1;
	while (end > pos) {
		*end = *(end - 1);
		end--;
	}
	*pos = x;
	_finish++;
	return pos;
}

对于插入数据的操作都要进行扩容的判断操作,对于数据的挪动我们可以采用依次赋值,就像代码中的*end=*(end-1);end--//*(it-1)=*it;it++;

通过画图可以更加清楚的理解。

数据打印

template<class T>
void print_vector(const vector<T>& v) {
	//typename vector<T>::const_iterator it = v.begin();
	auto it = v.begin();
	while (it != v.end()) {
		cout << *it << " ";
		it++;
	}
	cout << '\n';
    for  (auto e:v) {
		cout << e << " ";
	}
	cout << endl;
}
template<class Container>
void print_container(const Container& v) {
	auto it = v.begin();
	while (it != v.end()) {
		cout << *it << " ";
		it++;
	}
	cout << '\n';
	for (auto e : v) {
		cout << e << " ";
	}
	cout << endl;
}

规定,没有实例化的类模板里面取东西,编译器不能区分这里const_iterator是类型还是静态成员变量,所以在注释的部分我们看见前面加了个typename.

//typename vector<T>::const_iterator it = v.begin();

print_vector 函数专门用于打印 std::vector<T> 类型的容器。

print_container 函数是一个更通用的模板函数,可以用于打印任何符合容器概念的类型。

 

void vector5()
{
	vector<string> v;
	v.push_back("11111111111111111111");
	v.push_back("11111111111111111111");
	v.push_back("11111111111111111111");
	v.push_back("11111111111111111111");
	print_container(v);

	v.push_back("11111111111111111111");
	print_container(v);
}

拷贝构造和赋值重载

vector(const vector<T>& v) {
reserve(v.size());
for (auto e : v) {
	push_back(e);
}
}
vector<T>operator=(const vector<T>& v) {
if (this != v) {
	reserve(v.size());
	for (auto e : v) {
		push_back(e);
	}
}
return this;
		}

这一种思路是开设新空间,然后将数据一个个尾插到创建的对象中。

void swap(vector<T>& v)
		{
			std::swap(_start, v._start);
			std::swap(_finish, v._finish);
			std::swap(_end_of_storage, v._end_of_storage);
		}

		// v1 = v3
		//vector& operator=(vector v)
		vector<T>& operator=(vector<T> v)
		{
			swap(v);

			return *this;
		}

这种思路是交换的方式,通过调用官方库中的函数,指针交换,将v的地址给了创建的对象。

template <class InputIterator>
vector(InputIterator first, InputIterator last) {
	while (first != last) {
		push_back(*first);
		first++;
	}
}

通过传需要拷贝的对象的数据范围给新对象(迭代器区间),是个函数模版,可以用任意的迭代器初始化,类型匹配即可 。

模板构造函数,用于构造一个std::vector,该构造函数接受两个迭代器firstlast,它们定义了要复制到新vector中的元素的范围。

3.扩展延伸,深度理解代码

在VS环境下,比较严格,在迭代器方面比较严格,特别是失效迭代器的访问。

迭代器失效问题

在测试接口的过程中,有个bug就是迭代器失效问题

我们知道迭代器的主要作用就是让算法能够不用关心底层数据结构,其底层实际就是一个指针,或者是对指针进行了封装,比如:vector的迭代器就是原生态指针T*

因此迭代器失效,实际就是迭代器 底层对应指针所指向的空间被销毁了,而使用一块已经被释放的空间,造成的后果是程序崩溃(即 如果继续使用已经失效的迭代器,程序可能会崩溃)。

1.对vector进行扩容操作,像resize,reserve等操作

还有就是在insert,push_back操作过程中涉及了扩容

#include <iostream>
using namespace std;
#include <vector>
int main()
{
    vector<int> v{ 1,2,3,4,5,6 };
    auto it = v.begin();
    // 将有效元素个数增加到100个,多出的位置使用8填充,操作期间底层会扩容
   // v.resize(100, 8);
    // reserve的作用就是改变扩容大小但不改变有效元素个数,操作期间可能会引起底层容
    //量改变
         v.reserve(100);
         // 插入元素期间,可能会引起扩容,而导致原空间被释放
        v.insert(v.begin(), 0);
          v.push_back(8);
         // 给vector重新赋值,可能会引起底层容量改变
        //v.assign(100, 8);
    /*
   出错原因:以上操作,都有可能会导致vector扩容,也就是说vector底层原理旧空间被释
   放掉,而在打印时,it还使用的是释放之间的旧空间,在对it迭代器操作时,实际操作的是一块
   已经被释放的空间,而引起代码运行时崩溃。
   解决方式:在以上操作完成之后,如果想要继续通过迭代器操作vector中的元素,只需给
   it重新赋值即可。
   */
    while (it != v.end())
    {
        cout << *it << " ";
        ++it;
    }
    cout << endl;
    return 0;
}

修改后的代码 

#include <iostream>
#include <vector>
using namespace std;

int main()
{
    vector<int> v{ 1,2,3,4,5,6 };
    // 在修改vector之后,重新获取迭代器
    auto it = v.begin();
    
    v.reserve(100);
    v.insert(v.begin(), 0);
    v.push_back(8);
    // 如果使用v.assign(100, 8);,也需要在之后重新获取迭代器

    // 重新获取迭代器,因为之前的操作可能会改变vector的内存
    it = v.begin();

    while (it != v.end())
    {
        cout << *it << " ";
        ++it;
    }
    cout << endl;
    return 0;
}

还有一点就是insert数据过后,即使没有扩容,指向容器中插入点之后的所有迭代器、指针和引用都可能失效。

所以当我们继续访问修改p的位置数据,已经失效了,需要更新失效的迭代器。

由于数据挪动,p的指向改变了,所以我们认为迭代器也失效了。

v.insert(p, 40);

p=v.insert(p, 40);
(*(p+1)) *= 10; 

 2.erase的删除导致的迭代器失效问题

	void test_vector3()
	{
		std::vector<int> v;
		v.push_back(1);
		v.push_back(2);
		v.push_back(3);
		v.push_back(4);

		print_container(v);

		// 删除所有的偶数
		auto it = v.begin();
		while (it != v.end())
		{
			if (*it % 2 == 0)
			{
				v.erase(it);
			}
			else
			{
				++it;
			}
		}

		print_container(v);
	}
}

当我们用VS std中的接口时,会发现直接报错

所以我们也要进行重新的更新

it=v.erase(it); 

#include <iostream>
using namespace std;
#include <vector>
    int main()
    {
        int a[] = { 1, 2, 3, 4 };
        vector<int> v(a, a + sizeof(a) / sizeof(int));
        // 使用find查找3所在位置的iterator
        vector<int>::iterator pos = find(v.begin(), v.end(), 3);
        // 删除pos位置的数据,导致pos迭代器失效。
        v.erase(pos);
        cout << *pos << endl; // 此处会导致非法访问
        return 0;
    }

使用memcpy的拷贝问题

当我们想拷贝几个字符串时,就会出现问题了。

 问题分析:

1. memcpy是内存的二进制格式拷贝,将一段内存空间中内容原封不动的拷贝到另外一段内存空间中。

2. 如果拷贝的是自定义类型的元素,memcpy既高效又不会出错,但如果拷贝的是自定义类型元素,并且自定义类型元素中涉及到资源管理时,就会出错,因为memcpy的拷贝实际是浅拷贝。

void reserve(size_t n) {
	if (n > capacity()) {
		size_t oldsize = size();
		T* temp = new T[n];
       memcpy(tmp, _start, old_size * sizeof(T));
/*
		for (size_t i = 0; i < oldsize; i++) {
			temp[i] = _start[i];
		}
*/
		delete[]_start;
		_start = temp;
		_finish =temp + oldsize;
		_end_of_storage = temp+n;
	}
}

当我们使用这个memcpy版本进行扩容插入时,程序会出现问题

测试代码

void vector5() {
	vector<string> v;
	v.push_back("11111111111111111111");
	v.push_back("11111111111111111111");
	v.push_back("11111111111111111111");
	v.push_back("11111111111111111111");
	print_container(v);

	v.push_back("11111111111111111111");
	print_container(v);
}

memcpy是浅拷贝,temp和原来的v指向了同一块空间,当调用了delete[]时,11111111...字符串被析构了,空间释放,变成随机值,后面又delete,free _start ,这时候temp指向的是释放的空间。

所以我们可以调用赋值,就可以解决问题,本质调用string的赋值,其他类型赋值一样的。

旧空间释放就不会影响新空间。

for (size_t i = 0; i < oldsize; i++) {
            temp[i] = _start[i];

4.完整代码复现

#pragma once
#include <iostream>
#include <assert.h>
#include <vector>
#include <string>
using namespace std;
namespace my_vector {
	template<class T>
	class vector {
	public:
		typedef T* iterator;
		typedef const T* const_iterator;
		vector()
		{}

		vector(const vector<T>& v) {
			reserve(v.size());
			for (auto e : v) {
				push_back(e);
			}
		}
		/*
		vector<T>operator=(const vector<T>& v) {
			if (this != v) {
				reserve(v.size());
				for (auto e : v) {
					push_back(e);
				}
			}
			return this;
		}
		*/
		template <class InputIterator>
		vector(InputIterator first, InputIterator last) {
			while (first != last) {
				push_back(*first);
				first++;
			}
		}
		void swap(vector<T>& v)
		{
			std::swap(_start, v._start);
			std::swap(_finish, v._finish);
			std::swap(_end_of_storage, v._end_of_storage);
		}

		// v1 = v3
		//vector& operator=(vector v)
		vector<T>& operator=(vector<T> v)
		{
			swap(v);

			return *this;
		}

		void clear() {
			_finish = _start;
		}
		~vector() {
			if (_start) {
				delete[]_start;
				_start = _finish = _end_of_storage = nullptr;
			}
		}
		iterator begin() {
			return _start;
		}
		iterator end() {
			return _finish;
		}
		const_iterator begin()const {
			return _start;
		}
		const_iterator end() const {
			return _finish;
		}
		void reserve(size_t n) {
			if (n > capacity()) {
				size_t oldsize = size();
				T* temp = new T[n];
				memcpy(temp, _start, oldsize*sizeof(T));
				/*
				for (size_t i = 0; i < oldsize; i++) {
					temp[i] = _start[i];
				}
				*/
				delete[]_start;
				_start = temp;
				_finish = temp + oldsize;
				_end_of_storage = temp + n;
			}
		}
		void resize(size_t n, T val = T()) {
			if (n < size()) {
				_finish = _start + n;
			}
			else {
				reserve(n);
				while (_finish < _start + n) {
					*_finish = val;
					_finish++;
				}
			}

		}
		void push_back(const T& x) {
			if (_finish == _end_of_storage) {
				reserve(capacity() == 0 ? 4 : capacity() * 2);
			}
			*_finish = x;
			++_finish;
		}
		void pop_back() {
			assert(!empty());
			--_finish;
		}
		void erase(iterator pos) {
			assert(pos >= _start);
			assert(pos <= _finish);
			iterator it = pos + 1;
			while (it != end()) {
				*(it - 1) = *it;
				it++;
			}
			_finish--;
		}
		iterator insert(iterator pos, const T& x) {
			assert(pos >= _start && pos <= _finish);
			if (_finish == _end_of_storage) {
				size_t len = pos - _start;
				reserve(capacity() == 0 ? 4 : capacity() * 2);
				pos = _start + len;
			}
			iterator end = _finish + 1;
			while (end > pos) {
				*end = *(end - 1);
				end--;
			}
			*pos = x;
			_finish++;
			return pos;
		}
		size_t size()const {
			return _finish - _start;
		}
		size_t capacity()const {
			return _end_of_storage - _start;
		}
		bool empty()const {
			return _start == _finish;
		}
		T& operator[](size_t i) {
			assert(i < size());
			return _start[i];
		}
		const T& operator[](size_t i) const
		{
			assert(i < size());

			return _start[i];
		}

	private:
		iterator _start = nullptr;
		iterator _finish = nullptr;
		iterator _end_of_storage = nullptr;
	};
	template<class T>
	void print_vector(const vector<T>& v) {
		//typename vector<T>::const_iterator it = v.begin();
		auto it = v.begin();
		while (it != v.end()) {
			cout << *it << " ";
			it++;
		}
		cout << '\n';
		for (auto e : v) {
			cout << e << " ";
		}
		cout << endl;
	}
	template<class Container>
	void print_container(const Container& v) {
		/*
		auto it = v.begin();
		while (it != v.end()) {
			cout << *it << " ";
			it++;
		}
		cout << '\n';
		*/
		for (auto e : v) {
			cout << e << " ";
		}
		cout << endl;
	}
	void vector1() {
		vector<int>v;
		v.push_back(1);
		v.push_back(2);
		v.push_back(3);
		v.push_back(4);
		v.push_back(5);
		v.push_back(6);
		int x;
		cin >> x;
		auto p = find(v.begin(), v.end(), x);
		if (p != v.end()) {
			p = v.insert(p, 40);
			(*(p + 1)) *= 10;
		}

		//v.pop_back();
		//v.pop_back();
		//v.insert(v.begin() + 2, 5);

		//v.erase(v.begin() + 3);
		for (size_t i = 0; i < v.size(); i++) {
			cout << v[i] << endl;
		}

	}
	void vector2() {
		vector<int>v;
		v.push_back(1);
		v.push_back(2);
		v.push_back(3);
		v.push_back(4);
		v.push_back(5);
		v.push_back(6);
		print_vector(v);
		vector<int>v1(v);
		vector <int>v2 = v;
		vector<int> v3(v1.begin(), v1.begin() + 3);
		print_container(v1);
		print_container(v2);
		print_container(v3);
		/*
		vector<double>v1;
		v1.push_back(1.1);
		v1.push_back(2.2);
		v1.push_back(3.3);
		v1.push_back(4.4);
		v1.push_back(5.5);
		v1.push_back(6.6);
		print_container(v1);
		*/
	}
	void vector3() {
		vector<int> v;
		v.resize(10, 1);
		v.reserve(20);

		print_container(v);
		cout << v.size() << endl;
		cout << v.capacity() << endl;

		v.resize(15, 2);
		print_container(v);

		v.resize(25, 3);
		print_container(v);

		v.resize(5);
		print_container(v);
	}
	void vector4() {
		vector<int> v;
		v.push_back(1);
		v.push_back(2);
		v.push_back(3);
		v.push_back(4);
		v.push_back(4);
		v.push_back(5);
		print_container(v);

		// 删除所有的偶数
		auto it = v.begin();
		while (it != v.end())
		{
			if (*it % 2 == 0)
			{
				v.erase(it);
			}
			else {//不加else,不会删除连续的偶数,会++两次
				++it;
			}

		}

		print_container(v);
	}
	void test_vector3()
	{
		std::vector<int> v;
		v.push_back(1);
		v.push_back(2);
		v.push_back(3);
		v.push_back(4);

		print_container(v);

		// 删除所有的偶数
		auto it = v.begin();
		while (it != v.end())
		{
			if (*it % 2 == 0)
			{
				it=v.erase(it);
			}
			else
			{
				++it;
			}
		}

		print_container(v);
	}
	void vector5() {
		vector<string> v;
		v.push_back("11111111111111111111");
		v.push_back("11111111111111111111");
		v.push_back("11111111111111111111");
		v.push_back("11111111111111111111");
		print_container(v);

		v.push_back("11111111111111111111");
		print_container(v);
	}
}

结束语

本期博客就到此结束啦,相信通过自己对vector的实现,大家对vector有了更深的了解。

最后希望友友们给小编点点赞吧,感谢各位友友的支持!!!