1.8 内存管理之堆

1.8.1 什么是堆

堆(heap)也是一种动态内存管理方式。内存管理对操作系统来说是一件非常复杂的事情,因为首先内存容量很大,其次内存需求在时间和大小块上没有规律(操作系统上运行着的几十、几百、几千个进程随时都会申请或者释放内存,申请或者释放的内存块大小随意)。

堆这种内存管理方式特点就是自由(随时申请、释放,大小块随意)。我们前面就讲过这两个API(malloc和free),那时候我们只是讲了用这两个接口可以申请和释放内存,但并没有说是从什么地方申请,以及通过什么申请。其实它们申请释放的内存来源于堆内存,然后向使用者(用户进程)提供API(malloc和free)来使用堆内存。我们什么时候使用堆内存?需要内存容量比较大时,以及需要反复使用及释放时(动态特性),很多数据结构(譬如链表)的实现都要使用堆内存。

1.8.2 堆管理内存的特点(大块内存、手工分配/使用/释放)

特点一:容量不限,动态分配(常规使用的需求容量都能满足)。当然也并不是完全不限,因为它毕竟建立在内存的基础上,所以在申请堆内存的时候一定要注意malloc函数的返回值,如果返回值是NULL,就是申请空间失败。而所谓动态,就是指程序在运行中取得内存空间,而不是编译时就确定好固定大小的内存空间。

特点二:申请和释放都需要手工进行。手工进行的含义就是需要程序员写代码明确进行申请(malloc)及释放(free)。如果程序员申请内存但使用后并不释放,这段内存就丢失了(在堆管理器的记录中,这段内存仍然属于你这个进程,但是进程会认为这段内存已经被占用,再用的时候又会去申请新的内存块),这称为内存泄漏。在C/C++语言中,内存泄漏是最严重的程序bug,这也是别人认为Java/C#等语言比C/C++优秀的地方。

1.8.3 C语言操作堆内存的接口(malloc/free)

堆内存释放时最简单,直接调用free释放,即void free(void *ptr);。

堆内存申请时,有三个可选择的兄弟函数:malloc、calloc和realloc。和malloc相比,它的两个兄弟calloc, realloc在功能上更加强大。二弟calloc会将返回的内存初始化为0,而三弟realloc可以修改原先已经分配的内存块的大小。而malloc只是单纯地从内存中申请固定大小的内存。

              void *malloc(size_t size);
              void *calloc(size_t nmemb, size_t size);  // nmemb个单元,每个单元size字节
              void *realloc(void *ptr, size_t size);    // 改变原来申请的空间的大小的

如要申请10个int元素的内存,如下所示。

              malloc(40);                 malloc(10*sizeof(int));
              calloc(10, 4);              calloc(10, sizeof(int));

数组定义时,必须同时给出数组元素个数(数组的大小),而且一旦定义再无法更改。在Java等高级语言中,有一些语法技巧好像可以更改数组大小,但其实这只是一种障眼法。它的工作原理是:先新建一个新需求大小的数组,再将原数组的所有元素复制进新的数组,然后释放掉原数组,最后返回新的数组给用户。堆内存申请时必须给定大小,然后一旦申请完成则空间大小不变,如果要变,只能通过realloc接口。realloc的实现原理类似于上面介绍的Java中可变大小数组的方式。

1.8.4 堆的优势和劣势(管理大块内存、灵活、容易内存泄漏)

优势:灵活。

劣势:需要程序员去处理各种细节,所以容易出错,严重依赖于程序员的水平。

局部变量存在于栈(stack)中,全局变量存在于静态数据区中,动态申请数据存在于堆(heap)中。

1.8.5 静态存储区

我们现在知道,非静态局部变量存储在栈中,但程序中不仅仅只有非静态局部变量,还有静态局部变量和全局变量。静态局部变量和全局变量存储在静态存储区。编译器在编译程序时就确定了静态存储区的大小,静态存储区随着程序运行而分配空间,直到程序运行结束才释放内存空间,这也正是我们定义静态变量或者全局变量的目的。相比于栈,静态存储区对内存的操作比较简单,就是在编译期分配一块确定大小的内存,用来存储数据。局部变量存在于栈(stack)中,全局变量和静态局部变量存在于静态存储区中,动态申请数据存在于堆(heap)中。这里我们做个比喻,栈、堆、静态存储区相当于程序中的三国,它们的地盘就是内存,它们对各自地盘的施政(对内存的管理)方针也各不相同。