定长内存池设计核心:如何用固定块内存实现零碎片管理

发布于:2025-03-26 ⋅ 阅读:(25) ⋅ 点赞:(0)

一、池化技术

        所谓“池化技术”,就是程序先向系统申请过量的资源,然后⾃⼰管理,以备不时之需。之所以要申请过量的资源,是因为每次申请该资源都有较⼤的开销,不如提前申请好了,这样使⽤时就会变得⾮常快捷,⼤⼤提⾼程序运⾏效率。
        在计算机中,有很多使⽤“池”这种技术的地⽅,除了内存池,还有连接池、线程池、对象池等。以服务器上的线程池为例,它的主要思想是:先启动若⼲数量的线程,让它们处于睡眠状态,当接收到客户端的请求时,唤醒池中某个睡眠的线程,让它来处理客户端的请求,当处理完这个请求,线程⼜进⼊睡眠状态。

二、内存池

       内存池是指程序预先从操作系统申请⼀块⾜够⼤的内存,此后,当程序中需要申请内存的时候,不是直接向操作系统申请,⽽是直接从内存池中获取;同理,当程序释放内存的时候,并不真正将内存返回给操作系统,⽽是返回内存池。当程序退出(或者特定时间)时,内存池才将之前申请的内存真正释放。

三、内存池主要解决的问题

        内存池主要解决的当然是效率的问题,其次如果作为系统的内存分配器的⻆度,还需要解决⼀下内存碎⽚的问题。那么什么是内存碎⽚呢?
        内存碎⽚分为外碎⽚和内碎⽚,外部碎⽚是⼀些空闲的连续内存区域太⼩,这些内存空间不连续,以⾄于合计的内存⾜够,但是不能满⾜⼀些的内存分配申请需求。内部碎⽚是由于⼀些对⻬的需求,导致分配出去的空间中⼀些内存⽆法被利⽤。

        malloc申请内存能适应于大多数场景,是通用的,但在某些特定场景下效率并不高,而且可能会产生大量的内存碎片。

四、定长内存池的实现

1.定长内存池的原理

        如上所述,我们先向系统申请一大块空间,然后当我们需要申请内存时就从这块空间上获取,我们把空间用完后不用急着释放回系统,而是把它用一个自由链表连接起来,进行二次利用。也就是说我们再次申请空间时可以在这块废弃的空间上找,如果没有再去大空间上找,如果还不够再去向系统申请。

2.框架

        封装一个类,它的成员变量应包括:一个size_t类型储存该块空间的字节大小一个void*指针储存自由链表的头char*指针指向这块空间的起始地址,char*类型指针每加1只向后移动一字节,方便指针的移动。因为我们每被用户申请一小块空间后,指针往后移动到下一个为没利用的空间的起始地址。

template <typename T>
class FixedMemoryPool
{
public:
    T *New();
    void Delete(T *p);
private:
    size_t _sumSize = 0;
    char *_memory = nullptr;
    void *_list_head = nullptr;
};

        初始化操作只需要在成员变量声明这里进行,然后使用默认的构造函数就可以,主要需要我们来实现New和Delete的逻辑。

3.Delete实现

        Delete主要就是来维护自由链表,我们先来实现自由链表,因为在New中需要先在自由链表中查找空间。首先执行它的析构清空在它身上申请的空间。因为头插比较方便,我们直接把它头插到自由链表中。接下来就是头插操作:

        我们把这块需要插入到链表的废弃空间记为p,首先把_list_head储存到p空间的前4/8字节,因为并不确定用户用的是32位系统还是64位系统,所以可以用这样一个操作来解决:

*(void **)p = _list_head;

然后_list_head = p,如下:

void Delete(T *p)
{
    p->~T();
    *(void **)p = _list_head;
    _list_head = p;
}

4.New实现

        我们先来定义一个T* ret用来储存返回值,然后先去自由链表里找空间,如:

if (_list_head != nullptr)
{
    ret = (T *)_list_head;
    _list_head = *(void **)_list_head;
}

        大家看到 _list_head = *(void **)_list_head 这个代码可能会一点懵我来逐一讲解以下:

        _list_head是一个void*指针,储存了一个地址,而这个地址空间里面又储存了下一个节点的指针,(void**)相当于告诉编译器我是指向一个void*类型的指针,然后进行解引用得到这块地址,并更新_list_head。

如果链表里没有空间向大空间里获取:

else
{
    int objSize = max(sizeof(T), sizeof(void *));
    if (_sumSize < objSize)//空间不够向系统申请
    {
        _memory = (char *)malloc(128 * 1024);
        _sumSize = 128 * 1024;
    }
    ret = (T *)_memory;
    _memory += objSize;//移向未被利用的起始空间
    _sumSize -= objSize;//更新剩余空间的大小
}

objSize的作用:

        因为我们要保证这块空间至少要能存放得下一个地址,要不然被弃用后无法连接到自由链表。

        注意这里_sumSize不能是+=128*1024,因为_memory的初始地址已经更新了,要与_memory匹配。

最后对ret使用定位 new 后返回即可。

5.性能测试

源码已放在下文,如下是测试结果:

我们可以看到用定长内存池比new申请内存要快得多得多。

注:new的底层调用的就是malloc。

五、源码

FixedMemoryPool.h

#include <iostream>
#include <string>
#include <algorithm>
#include <memory>
using namespace std;
namespace my_MemoryPool
{
    template <typename T>
    class FixedMemoryPool
    {
    public:
        T *New()
        {
            T *ret = nullptr;
            if (_list_head != nullptr)
            {
                ret = (T *)_list_head;
                _list_head = *(void **)_list_head;
            }
            else
            {
                int objSize = max(sizeof(T), sizeof(void *));
                if (_sumSize < objSize)
                {
                    _memory = (char *)malloc(128 * 1024);
                    _sumSize = 128 * 1024;
                }
                ret = (T *)_memory;
                _memory += objSize;
                _sumSize -= objSize;
            }
            new (ret) T;
            return ret;
        }
        void Delete(T *p)
        {
            p->~T();
            *(void **)p = _list_head;
            _list_head = p;
        }

    private:
        size_t _sumSize = 0;
        char *_memory = nullptr;
        void *_list_head = nullptr;
    };
}

test.cc

#include "FixedMemoryPool.h"
#include <vector>
using namespace my_MemoryPool;
struct TreeNode
{
	int _val;
	TreeNode* _left;
	TreeNode* _right;
	TreeNode()
		:_val(0)
		, _left(nullptr)
		, _right(nullptr)
	{}
};

void TestObjectPool()
{
	// 申请释放的轮次
	const size_t Rounds = 5;
	// 每轮申请释放多少次
	const size_t N = 10000;

	std::vector<TreeNode*> v1;
	v1.reserve(N);
	size_t begin1 = clock();
	for (size_t j = 0; j < Rounds; ++j)
	{
		for (int i = 0; i < N; ++i)
			v1.push_back(new TreeNode);
		for (int i = 0; i < N; ++i)
			delete v1[i];
		v1.clear();
	}
	size_t end1 = clock();

	std::vector<TreeNode*> v2;
	v2.reserve(N);
	FixedMemoryPool<TreeNode> TNPool;
	size_t begin2 = clock();
	for (size_t j = 0; j < Rounds; ++j)
	{
		for (int i = 0; i < N; ++i)
			v2.push_back(TNPool.New());
		for (int i = 0; i < N; ++i)
			TNPool.Delete(v2[i]);
		v2.clear();
	}
	size_t end2 = clock();

	cout << "new cost time:" << end1 - begin1 << endl;
	cout << "object pool cost time:" << end2 - begin2 << endl;
}
int main()
{
    TestObjectPool();
    return 0;
}