[Linux]mmap()函数内存映射原理及用法

发布于:2025-06-30 ⋅ 阅读:(18) ⋅ 点赞:(0)

一、内存映射

内存映射,简而言之就是将用户空间的一段内存区域映射到内核空间,映射成功后,用户对这段内存区域的修改可以直接反映到内核空间,同样,内核空间对这段区域的修改也直接反映用户空间。那么对于内核空间和用户空间两者之间需要大量数据传输等操作的话效率是非常高的。
以下是一个把普遍文件映射到用户空间的内存区域的示意图:
示意图


二、mmap函数

1.基本介绍

mmap是一种内存映射文件的方法,即将一个文件或者其它对象映射到进程的地址空间,实现文件磁盘地址和进程虚拟地址空间中一段虚拟地址的一一对映关系。
实现这样的映射关系后,进程就可以采用指针的方式读写操作这一段内存,而系统会自动回写脏页面到对应的文件磁盘上,即完成了对文件的操作而不必再调用read,write等系统调用函数。相反,内核空间对这段区域的修改也直接反映用户空间,从而可以实现不同进程间的文件共享。如下图所示:
示意图

2.mmap的优势

通过系统调用mmap ,程序可以高效地访问文件数据,而无需通过传统的readwrite系统调用进行数据的复制,具体来说为:

  • 传统的readwrite分为两步(下面以write为例)
    • 第一步:用户态空间缓冲区 → 内核页缓冲区(其实就是内核文件缓冲区)
    • 第二步:内核页缓冲区 → 磁盘
  • 使用mmap
    • 映射阶段:内核将文件映射到进程的虚拟地址空间,但物理内存尚未分配(这是延迟申请,当真正访问阶段需要的时候才缺页中断分配)
    • 修改数据:进程直接修改映射的内存(相当于直接修改内核的页缓存),无需调用 write,也无用户态到内核态的数据拷贝

注意:当内核页缓存修改好了,我们就认为改好了,我们不关心内核缓冲区到磁盘的刷新这一过程(复杂)


三、mmap接口介绍

当我们建立好映射以后,就可以直接对“开辟”的空间进行操作(虚拟地址)
我们对虚拟地址的操作,都是直接修改映射的内存。

1. mmap建立映射

头文件<sys/mman.h>
函数原型

void *mmap(void *addr, size_t length, int prot, int flags,
           int fd, off_t offset);

参数说明

  • addr:建议的映射起始地址(通常设为NULL,由内核自动选择)
  • length:映射区域的长度(必须是页大小(4 KB)的整数倍,如4096字节)
  • prot:映射区的内存保护模式选项(用|链接)
    • PROT_READ:映射区可读
    • PROT_WRITE:映射区可写
    • PROT_EXEC:映射区可执行
    • 注意:映射权限必须<=文件打开权限
  • flags:映射类型(如MAP_SHARED MAP_PRIVATE
    • MAP_PRIVATE:创建⼀个私有映射。对映射区域的修改不会反映到底层文件中。(即:修改仅对当前进程有效(写时复制,类似 fork
    • MAP_SHARED:创建⼀个共享映射。对映射区域的修改会反映到底层文件中(即:修改会同步到文件,其他进程可见)
    • MAP_ANONYMOUS:指定要创建⼀个匿名内存映射
  • fd:文件描述符(匿名映射时设为 -1)
  • offset:文件偏移量(开始映射的位置相较于0位置处的偏移)(必须是页大小的整数倍)

返回值

  • 成功:返回映射区的起始地址(虚拟地址)
  • 失败:返回(void*) -1 或者 MAP_FAILED(等效的)

注意

  • 映射的要是一个已经打开的文件!
  • 文件大小为0的文件无法映射,需要先调整文件大小
    • ftruncate(fd, SIZE)(会把文件的内容全部初始化成\0
  • 映射的长度如果 > 文件的大小,则可能导致未定义行为
  • 因为mmap需要读取文件元数据(如大小):所以,即使你只需要写入权限,也需要在open文件的时候赋予读权限

2.munmap取消映射

函数原型

int munmap(void *addr, size_t length);

参数介绍

  • addr:映射空间的起始地址
  • length:空间长度(大小)

返回值

  • 成功:0
  • 错误:-1(错误码会被设置)

四、mmap的用法

1.写入映射

#include<iostream>
#include<cstdio>
#include<sys/mman.h>
#include<sys/types.h>
#include<sys/stat.h>
#include<fcntl.h>
#include<unistd.h>

#define FILENAME "log.txt"
#define SIZE 1024

int main()
{
    //open file
    int fd = open(FILENAME, O_RDWR|O_APPEND|O_CREAT, 0666);
    if (fd < 0)
    {
        perror("open");
        return 1;
    }

    // 调整file size
    ftruncate(fd, SIZE);

    //建立映射
    /*void *mmap(void *addr, size_t length, int prot, int flags,
           int fd, off_t offset);*/
    char* mmap_addr = (char*)mmap(nullptr, SIZE, PROT_WRITE, MAP_SHARED, fd, 0);
    if (mmap_addr == MAP_FAILED)
    {
        perror("mmap");
        return 2;
    }

    //写入操作
    for (int c = 'a', i = 0; c <= 'z'; c++, i++)
    {
        mmap_addr[i] = c;
    }

    //取消映射
    munmap(mmap_addr, SIZE);

    //关闭文件
    close(fd);
    std::cout << "写入映射完毕" << std::endl;

    return 0;
}

2.读取映射

#include<iostream>
#include<cstdio>
#include<sys/mman.h>
#include<sys/types.h>
#include<sys/stat.h>
#include<fcntl.h>
#include<unistd.h>

#define FILENAME "log.txt"

int main()
{
    //open file
    int fd = open(FILENAME, O_RDONLY);
    if (fd < 0)
    {
        perror("open");
        return 1;
    }

    struct stat st; // struct stat 类型的结构体用于记录文件的属性
    fstat(fd, &st);

    //建立映射
    char* mmap_addr = (char*)mmap(nullptr, st.st_size, PROT_READ, MAP_SHARED, fd, 0);
    if (mmap_addr == MAP_FAILED)
    {
        perror("mmap");
        return 2;
    }

    //读取操作
    std::cout << mmap_addr << std::endl;

    //取消映射
    munmap(mmap_addr, st.st_size);

    //关闭文件
    close(fd);
    std::cout << "读取映射完毕" << std::endl;

    return 0;
}

3.简单模拟实现malloc

在malloc里,对应大块的内存通常是使用mmap来分配的,而对应小块的内存,是用brk来分配的。

这里要再介绍一个flags选项:MAP_ANONYMOUS

  • MAP_ANONYMOUS:指定要创建⼀个匿名内存映射
  • 当使使用MAP_ANONYMOUS 标志时,mmap会分配⼀段不与任何⽂件相关联的内存区域(即这段内存没有⽂件作为其后端存储)。
  • 这种类型的映射通常用于需要分配私有内存的场景,例如进程内部的内存分配

下面用mmap简单模拟实现一下malloc

#include<iostream>
#include<cstdio>
#include<sys/mman.h>
#include<sys/types.h>
#include<sys/stat.h>
#include<fcntl.h>
#include<unistd.h>

#define SIZE 1024

void* MyMalloc(int size)
{
    //建立映射(匿名映射)--- 可读可写
    void* mmap_addr = mmap(nullptr, size, PROT_WRITE|PROT_READ, MAP_SHARED|MAP_ANONYMOUS, -1, 0);
    if (mmap_addr == MAP_FAILED)
    {
        perror("mmap");
        exit(EXIT_FAILURE);
    }
    return mmap_addr;
}

void* MyFree(void* mmap_addr, int size)
{
    if(munmap(mmap_addr, size) == -1)
    {
        perror("munmap");
        exit(EXIT_FAILURE);
    }
}

int main()
{
    char* ptr = (char*)MyMalloc(SIZE);

    //写入
    for (int c = 'a', i = 0; c <= 'z'; c++, i++)
    {
        ptr[i] = c;
    }
    //读取
    std::cout << "写入后的addr content: " << ptr << std::endl;
    MyFree(ptr, SIZE);

    return 0;
}

4.makefile

.PHONY:all
all:write read malloc
write:mmap_write.cc
	g++ -o $@ $^ -std=c++11
read:mmap_read.cc
	g++ -o $@ $^ -std=c++11
malloc:mmap_malloc.cc
	g++ -o $@ $^ -std=c++11

.PHONY:clean
clean:
	rm -f write read malloc

5.最终结果

在这里插入图片描述