c语言防止优化

2023-02-21 00:09:03Python05

c语言防止优化,第1张

编译器编译命令里有设置选项，通过设置，你可以要求不优化，也可以要求用哪种优化。具体选项有哪些，要查自己编译器的帮助文件。例如，MS VC++ 6.0 编译器编优化选项： /O1：优化使产生的可执行代码最小 /O2：优化使产生的可执行代码速度最快 /Oa：指示编译器程序里没有使用别名，可以提高程序的执行速度 /Ob：控制内联（inline）函数的展开 /Od：禁止代码优化 /Og：使用全局优化 /Oi：用内部函数去代替程序里的函数调用，可以使程序运行的更快，但程序的长度变长 /Op：提高浮点数比较运算的一致性 /Os：产生尽可能小的可执行代码 /Ot：产生尽可能块的可执行代码 /Ow：指示编译器在函数体内部没有使用别名 /Ox：组合了几个优化开关，达到尽可能多的优化 /Oy：阻止调用堆栈里创建帧指针/O2 为了加速，会优化掉。选 /Od 不优化。

volatile提醒编译器它后面所定义的变量随时都有可能改变，因此编译后的程序每次需要存储或读取这个变量的时候，都会直接从变量地址中读取数据。如果没有volatile关键字，则编译器可能优化读取和存储，可能暂时使用寄存器中的值，如果这个变量由别的程序更新了的话，将出现不一致的现象。下面举例说明。在DSP开发中，经常需要等待某个事件的触发，所以经常会写出这样的程序：

short flag

void test()

{

do1()

while(flag==0)

do2()

}

这段程序等待内存变量flag的值变为1(怀疑此处是0,有点疑问,)之后才运行do2()。变量flag的值由别的程序更改，这个程序可能是某个硬件中断服务程序。例如：如果某个按钮按下的话，就会对DSP产生中断，在按键中断程序中修改flag为1，这样上面的程序就能够得以继续运行。但是，编译器并不知道flag的值会被别的程序修改，因此在它进行优化的时候，可能会把flag的值先读入某个寄存器，然后等待那个寄存器变为1。如果不幸进行了这样的优化，那么while循环就变成了死循环，因为寄存器的内容不可能被中断服务程序修改。为了让程序每次都读取真正flag变量的值，就需要定义为如下形式：

volatile short flag

需要注意的是，没有volatile也可能能正常运行，但是可能修改了编译器的优化级别之后就又不能正常运行了。因此经常会出现debug版本正常，但是release版本却不能正常的问题。所以为了安全起见，只要是等待别的程序修改某个变量的话，就加上volatile关键字。

volatile的本意是“易变的”

由于访问寄存器的速度要快过RAM，所以编译器一般都会作减少存取外部RAM的优化。比如：

static int i=0

int main(void)

{

...

while (1)

{

if (i) do_something()

}

/* Interrupt service routine. */

void ISR_2(void)

{

i=1

}

程序的本意是希望ISR_2中断产生时，在main当中调用do_something函数，但是，由于编译器判断在main函数里面没有修改过i，因此可能只执行一次对从i到某寄存器的读操作，然后每次if判断都只使用这个寄存器里面的“i副本”，导致do_something永远也不会被调用。如果变量加上volatile修饰，则编译器保证对此变量的读写操作都不会被优化（肯定执行）。此例中i也应该如此说明。

一般说来，volatile用在如下的几个地方：

1、中断服务程序中修改的供其它程序检测的变量需要加volatile；

2、多任务环境下各任务间共享的标志应该加volatile；

3、存储器映射的硬件寄存器通常也要加volatile说明，因为每次对它的读写都可能由不同意义；

另外，以上这几种情况经常还要同时考虑数据的完整性（相互关联的几个标志读了一半被打断了重写），在1中可以通过关中断来实现，2中可以禁止任务调度，3中则只能依靠硬件的良好设计了。

二、volatile 的含义

volatile总是与优化有关，编译器有一种技术叫做数据流分析，分析程序中的变量在哪里赋值、在哪里使用、在哪里失效，分析结果可以用于常量合并，常量传播等优化，进一步可以死代码消除。但有时这些优化不是程序所需要的，这时可以用volatile关键字禁止做这些优化，volatile的字面含义是易变的，它有下面的作用：

1 不会在两个操作之间把volatile变量缓存在寄存器中。在多任务、中断、甚至setjmp环境下，变量可能被其他的程序改变，编译器自己无法知道，volatile就是告诉编译器这种情况。

2 不做常量合并、常量传播等优化，所以像下面的代码：

volatile int i = 1

if (i >0) ...

if的条件不会当作无条件真。

3 对volatile变量的读写不会被优化掉。如果你对一个变量赋值但后面没用到，编译器常常可以省略那个赋值操作，然而对Memory Mapped IO的处理是不能这样优化的。

前面有人说volatile可以保证对内存操作的原子性，这种说法不大准确，其一，x86需要LOCK前缀才能在SMP下保证原子性，其二，RISC根本不能对内存直接运算，要保证原子性得用别的方法，如atomic_inc。

对于jiffies，它已经声明为volatile变量，我认为直接用jiffies++就可以了，没必要用那种复杂的形式，因为那样也不能保证原子性。

你可能不知道在Pentium及后续CPU中，下面两组指令

inc jiffies

mov jiffies, %eax

inc %eax

mov %eax, jiffies

作用相同，但一条指令反而不如三条指令快。

三、编译器优化 → C关键字volatile → memory破坏描述符zz

“memory”比较特殊，可能是内嵌汇编中最难懂部分。为解释清楚它，先介绍一下编译器的优化知识，再看C关键字volatile。最后去看该描述符。

1、编译器优化介绍

内存访问速度远不及CPU处理速度，为提高机器整体性能，在硬件上引入硬件高速缓存Cache，加速对内存的访问。另外在现代CPU中指令的执行并不一定严格按照顺序执行，没有相关性的指令可以乱序执行，以充分利用CPU的指令流水线，提高执行速度。以上是硬件级别的优化。再看软件一级的优化：一种是在编写代码时由程序员优化，另一种是由编译器进行优化。编译器优化常用的方法有：将内存变量缓存到寄存器；调整指令顺序充分利用CPU指令流水线，常见的是重新排序读写指令。对常规内存进行优化的时候，这些优化是透明的，而且效率很好。由编译器优化或者硬件重新排序引起的问题的解决办法是在从硬件（或者其他处理器）的角度看必须以特定顺序执行的操作之间设置内存屏障（memory barrier），linux 提供了一个宏解决编译器的执行顺序问题。

void Barrier(void)

这个函数通知编译器插入一个内存屏障，但对硬件无效，编译后的代码会把当前CPU寄存器中的所有修改过的数值存入内存，需要这些数据的时候再重新从内存中读出。

2、C语言关键字volatile

C语言关键字volatile（注意它是用来修饰变量而不是上面介绍的__volatile__）表明某个变量的值可能在外部被改变，因此对这些变量的存取不能缓存到寄存器，每次使用时需要重新存取。该关键字在多线程环境下经常使用，因为在编写多线程的程序时，同一个变量可能被多个线程修改，而程序通过该变量同步各个线程，例如：

DWORD __stdcall threadFunc(LPVOID signal)

{

int* intSignal=reinterpret_cast<int*>(signal)

*intSignal=2

while(*intSignal!=1)

sleep(1000)

return 0

}

该线程启动时将intSignal 置为2，然后循环等待直到intSignal 为1 时退出。显然intSignal的值必须在外部被改变，否则该线程不会退出。但是实际运行的时候该线程却不会退出，即使在外部将它的值改为1，看一下对应的伪汇编代码就明白了：

mov ax,signal

label:

if(ax!=1)

goto label

对于C编译器来说，它并不知道这个值会被其他线程修改。自然就把它cache在寄存器里面。记住，C 编译器是没有线程概念的！这时候就需要用到volatile。volatile 的本意是指：这个值可能会在当前线程外部被改变。也就是说，我们要在threadFunc中的intSignal前面加上volatile关键字，这时候，编译器知道该变量的值会在外部改变，因此每次访问该变量时会重新读取，所作的循环变为如下面伪码所示：

label:

mov ax,signal

if(ax!=1)

goto label

3、Memory

有了上面的知识就不难理解Memory修改描述符了，Memory描述符告知GCC：

1）不要将该段内嵌汇编指令与前面的指令重新排序；也就是在执行内嵌汇编代码之前，它前面的指令都执行完毕

2）不要将变量缓存到寄存器，因为这段代码可能会用到内存变量，而这些内存变量会以不可预知的方式发生改变，因此GCC插入必要的代码先将缓存到寄存器的变量值写回内存，如果后面又访问这些变量，需要重新访问内存。

如果汇编指令修改了内存，但是GCC 本身却察觉不到，因为在输出部分没有描述，此时就需要在修改描述部分增加“memory”，告诉GCC 内存已经被修改，GCC 得知这个信息后，就会在这段指令之前，插入必要的指令将前面因为优化Cache 到寄存器中的变量值先写回内存，如果以后又要使用这些变量再重新读取。

使用“volatile”也可以达到这个目的，但是我们在每个变量前增加该关键字，不如使用“memory”方便。

【算法描述】

转某牛人的解题报告！！！！

这道题在没看数据规模之前以为是一道简单的DP，但是数据开到十亿，无论在时间还是空间复杂度都过大，所以就要进行优化了。

解一：

简单方法：预期得分30。简单动态规划，f[i]代表青蛙跳到i点时所可能踩到的最少石子数，所以有f[i]=min{f[k]+map[i]}(i-s≤k≤i-t)，其中map[i]代表i上是否有石子，有是1，否则0。算法复杂度O(n^2)。

解二：

改进方法：预期得分100。我们会发现，虽然桥很长，但上面最多只有100个石子，想到能否用石子DP，而应该是不行的。那能否基于第一种方法？由于石子排布非常的疏，我们还会发现，如果两个石子相隔甚远，那他们中间的f[i]大部分将会是同一个数，能否把两个石子的距离缩短，使之还与原来等效？要是行的话怎么缩？王乃岩同学考试时做了一个方法能够过全部数据，用的滚动数组存储，下面列出了他的程序。我自己也写了个程序，和他不尽相同：我令L=stone[i]-stone[i-1]（stone[i]代表按坐标由小到大顺序排列的石块坐标），当L能够被t整除时（L%t==0），令k=t；当L不能被t整除时（L%t!=0），令k=L%t。然后令k为k+t，最后判断如果k>L，那么map[]数组中stone[i]和stone[i-1]两石头的距离就被等效成为L（也就是没变）；如果k<=L，那么map[]数组中stone[i]和stone[i-1]两石头的距离就被等效成为k，可以看出来，这样处理完，两石子最大间距为2*t，大大的缩短了数组，再按解一进行DP，就可以通过了。

#include <stdio.h>

#include <string.h>

long stone[101]

int map[100001]

int f[100001]

long L

int S, T, M

void quickSort(int l, int r)

{

int i , j

long temp

i = l