C语言代码组成 - BSS、Data、Stack、Heap、Code、Const

2023-03-27 20:16:02Python017

C语言代码组成 - BSS、Data、Stack、Heap、Code、Const,第1张

一段C语言经过编译连接后，成为一段可以运行的代码，可运行的代码可以分为以下四个部分组成：全局变量/静态变量区、堆、栈、代码区。其中全局变量/静态变量区又分为未初始化变量区和初始化变量区，代码区又分为代码和常量区。即汇总下来，代码可以分为6部分组成，包括：BSS区（未初始化的全局变量/静态变量区）、Data区（实始化的全局变量区）、Stack区（栈区）、heap区（堆区）、Code区（代码区）、const区（常量区）。

一、BSS区和Data区

C语言编程中定义的全局变量、静态局部变量，就是分配在全局变量/静态变量区域，但是为什么又要分为BSS区域和Data区域呢？其实我们在定义全局或者静态变量区，有时我会对它赋初始值，有的又不会赋初始化，比如我们定义的全局变量，初始化的赋值，是怎么样写到变量区域中的，我们定义的静态局部变量，在定义时初始化后，为什么后面函数被调用，又不会再初始化呢？这个局部静态变量是怎么样实始化的，什么时候初始化的？

如果分析编译后的汇编代码，就会发现在代码运行起来后，会有一段给变量赋值的指令，这一段代码，不是我们C代码对应的汇编，而是C编译器生成的汇编译代码，这段代码的作用就是给初始化了的静态变量和全局变量进行初始化。这也是为什么全局/静态变量区域，要分BSS和Data的原因。

二、Stack区

栈是一种先进后出的数据结构，这种数据结构正好完美的匹配函数调用时的模型过程，比如函数f(a)在运行过程中调用函数f(b)，f(a）在运行过程中的变量就是分配在栈中，通过在调用f(b)前，会将代码中用到的R0~Rn寄存器的值保存到栈中，同时将函数的传入参数写入到栈中，然后进入f(b)函数，函数f(b)的变量b分配在栈中，当函数运行完毕后，释放变量b，将栈中存放的f（a）函数的运行的R0~Rn寄存器值恢复到寄存器中，同时f(b)的返回结果存入到栈中，这样f（a）继续运行。当一个函数运行完毕后，它在栈中分配的临时变量会全部释放。

对于中断也是一样的，中断发生时，也是一个函数打断了另一个函数的运行，这种现场的保存（即寄存器的值）,都是通过栈来完成的。所以栈的作用有：

三、Heap区

全局变量分配的内存在代码整个运行周期内都是有效的，而在栈区分配的内存在函数调用完成后，就会释放。这两种内存模型都是由编译器决定它的使用，代码是无法控制的。那有没有内存是由用户控制的，要用时，就自由分配，不用时，就自行释放？答案是肯定的，这部分内存就是堆。

用户需要使用的动态内存，就是通过malloc函数，调用分配的，在没有释放前，可一直由代码使用。当这部分内存不再需要使用时，可以通过free函数进行释放，将它归还到堆中。从这中可以看出，堆的内存，是按需分配的。这就是赋予了代码很大的自由度，但这也是会带来负作用的，比如：内存碎片化导致的malloc失败；忘记释放内存导致的内存泄露，而这些往往是致命的失误。

四、Code区

代码区就是编译后机器指令，这些指令决定了功能的执行。我们编译的代码一般是下载进flash中，但是运行，却有两种方式：在RAM中运行和在ROM中运行。在RAM中运行，即是boot启动后，将flash中的代码复制到RAM中，然后PC指针在指到RAM中的代码中开始运行。有时在调试时，我们可以直接将代码下载进RAM中运行进行调试，这样加快调试速度。便是大部分的情况我们的代码是从flash中开始运行的。

五、常量区

代码中的常量，一部分是作为立即数，在代码区中，但是像定义的字符串、给某数组赋值的一串数值，这些常量，就存在常量区，我们常用const来定义一个常量，即该变量不能再必变。这部分的变量，编译器一般将它定义的flash中。

六、各个区域大小的是如何决定的：

code区和const区：是由代码的大小和代码中常量的多少来决定的。

bss区和data区：这是由代码中定义的全局变量和局部变量的多少来决定的。

stack区：这个可以由使用都自行定义大小，但使用都要根据自已代码的情况，评估出一个合理的值，再定义其大小，如果定义的太小，很容易爆栈，导至代码异常，但是如果定义的太大，就容易浪费内存。

heap区：RAM剩下的部分，编译器就会作为堆区使用。

七、嵌入式代码一般启动过程

以STM32为例，通过分析其汇编启支代码，大致可以分为以下几个步骤：

如果大家想看编译扣，代码文件的组成，可以查看统后生的map文件，里面有详细的数据，包括各个函数的分配内存，BSS，Data，Stack，Heap，Text的分配情况。

如果相要了解详细的代码启动过程，可看它的启动汇编文件。

简单地说!Heap存储全局静态变量, Stack存储局部变量!

另外Stack可以用来动态地分配内存块.这个在C++中用得比较多.C中不建议用库函数中带的动态分配函数来分配内存块，很容易产生内存泄漏！

堆(heap)和栈(stack)有什么区别??

简单的可以理解为：

heap：是由malloc之类函数分配的空间所在地。地址是由低向高增长的。

stack：是自动分配变量，以及函数调用的时候所使用的一些空间。地址是由高向低减少的。

预备知识—程序的内存分配

一个由c/C++编译的程序占用的内存分为以下几个部分

1、栈区（stack）— 由编译器自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中的栈。

2、堆区（heap） — 一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式倒是类似于链表，呵呵。

3、全局区（静态区）（static）—，全局变量和静态变量的存储是放在一块的，初始化的全局变量和静态变量在一块区域，未初始化的全局变量和未初始化的静态变量在相邻的另一块区域。 - 程序结束后有系统释放

4、文字常量区 —常量字符串就是放在这里的。程序结束后由系统释放

5、程序代码区—存放函数体的二进制代码。

二、例子程序

这是一个前辈写的，非常详细

//main.cpp

int a = 0全局初始化区

char *p1全局未初始化区

main()

{

int b栈

char s[] = "abc"栈

char *p2栈

char *p3 = "123456"123456在常量区，p3在栈上。

static int c =0；全局（静态）初始化区

p1 = (char *)malloc(10)

p2 = (char *)malloc(20)

分配得来得10和20字节的区域就在堆区。

strcpy(p1, "123456")123456放在常量区，编译器可能会将它与p3所指向的"123456"优化成一个地方。

}

二、堆和栈的理论知识

2.1申请方式

stack:

由系统自动分配。例如，声明在函数中一个局部变量 int b系统自动在栈中为b开辟空间

heap:

需要程序员自己申请，并指明大小，在c中malloc函数

如p1 = (char *)malloc(10)

在C++中用new运算符

如p2 = (char *)malloc(10)

但是注意p1、p2本身是在栈中的。

2.2

申请后系统的响应

栈：只要栈的剩余空间大于所申请空间，系统将为程序提供内存，否则将报异常提示栈溢出。

堆：首先应该知道操作系统有一个记录空闲内存地址的链表，当系统收到程序的申请时，

会遍历该链表，寻找第一个空间大于所申请空间的堆结点，然后将该结点从空闲结点链表中删除，并将该结点的空间分配给程序，另外，对于大多数系统，会在这块内存空间中的首地址处记录本次分配的大小，这样，代码中的delete语句才能正确的释放本内存空间。另外，由于找到的堆结点的大小不一定正好等于申请的大小，系统会自动的将多余的那部分重新放入空闲链表中。

2.3申请大小的限制

栈：在Windows下,栈是向低地址扩展的数据结构，是一块连续的内存的区域。这句话的意思是栈顶的地址和栈的最大容量是系统预先规定好的，在 WINDOWS下，栈的大小是2M（也有的说是1M，总之是一个编译时就确定的常数），如果申请的空间超过栈的剩余空间时，将提示overflow。因此，能从栈获得的空间较小。

堆：堆是向高地址扩展的数据结构，是不连续的内存区域。这是由于系统是用链表来存储的空闲内存地址的，自然是不连续的，而链表的遍历方向是由低地址向高地址。堆的大小受限于计算机系统中有效的虚拟内存。由此可见，堆获得的空间比较灵活，也比较大。

2.4申请效率的比较：

栈由系统自动分配，速度较快。但程序员是无法控制的。

堆是由new分配的内存，一般速度比较慢，而且容易产生内存碎片,不过用起来最方便.

另外，在WINDOWS下，最好的方式是用VirtualAlloc分配内存，他不是在堆，也不是在栈是直接在进程的地址空间中保留一快内存，虽然用起来最不方便。但是速度，也最灵活

2.5堆和栈中的存储内容

栈：在函数调用时，第一个进栈的是主函数中后的下一条指令（函数调用语句的下一条可执行语句）的地址，然后是函数的各个参数，在大多数的C编译器中，参数是由右往左入栈的，然后是函数中的局部变量。注意静态变量是不入栈的。

当本次函数调用结束后，局部变量先出栈，然后是参数，最后栈顶指针指向最开始存的地址，也就是主函数中的下一条指令，程序由该点继续运行。

堆：一般是在堆的头部用一个字节存放堆的大小。堆中的具体内容有程序员安排。

2.6存取效率的比较

char s1[] = "aaaaaaaaaaaaaaa"

char *s2 = "bbbbbbbbbbbbbbbbb"