β

为什么手工drop_caches之后cache值并未减少?

Linux Performance 139 阅读

在Linux系统上查看内存使用状况最常用的命令是”free”,其中buffers和cache通常被认为是可以回收的:

$ free
             total       used       free     shared    buffers     cached
Mem:      32764716    1067548   31697168     158332         12     593096
-/+ buffers/cache:     474440   32290276
Swap:      2103292          0    2103292

当内存紧张的时候,有一个常用的手段就是使用下面的命令来手工回收cache:

$ echo 1 > /proc/sys/vm/drop_caches

注:drop_caches接受以下三种值:

当我们考虑有多少cache可供回收的时候,首先要知道的是:不同版本的”free”命令计算cache值的算法不同,据不完全统计举例如下:

  1. 版本:procps-3.2.8-36
    cache值等于/proc/meminfo中的”Cached”;
  2. 版本:procps-3.3.9-10.1
    cache值等于/proc/meminfo的 [Cached + SReclaimable];
  3. 版本:procps-ng-3.3.10-3
    cache值等于/proc/meminfo的 [Cached + Slab]。

注:
/proc/meminfo中的”Cached”表示page cache所占用的内存大小;
“Slab”表示内核Slab所占用的内存大小,slab有的可回收有的不可回收,其中可回收的通过”SReclaimable”表示,不可回收的通过”SUnreclaim”表示。
所以,对上述第2、3版本的”free”命令,”echo 1 > /proc/sys/vm/drop_caches”对其中的SReclaimable或Slab部分是不起作用的。

即便仅考虑page cache (对应于 /proc/meminfo 的”Cached”),也并不是所有的页面都可以回收的:

首先,drop_caches只回收clean pages,不回收dirty pages,参见 https://www.kernel.org/doc/Documentation/sysctl/vm.txt
所以如果想回收更多的cache,应该在drop_caches之前先执行”sync”命令,把dirty pages变成clean pages。

其次,即使提前执行了sync命令,drop_cache操作也不可能把cache值降到0,甚至有时候cache值几乎没有下降,这是为什么呢?因为page cache中包含的tmpfs和共享内存是不能通过drop_caches回收的。

Page cache用于缓存文件里的数据,不仅包括普通的磁盘文件,还包括了tmpfs文件,tmpfs文件系统是将一部分内存空间模拟成文件系统,由于背后并没有对应着磁盘,无法进行paging(换页),只能进行swapping(交换),在执行drop_cache操作的时候tmpfs对应的page cache并不会回收。

我们通过实验来观察tmpfs文件对free命令的影响:

挂载一个3G大小的tmpfs:
$ mount -t tmpfs -o size=3G none /mytmpfs/

此时free命令看到的内存使用状况:
$ free
             total       used       free     shared    buffers     cached
Mem:      65942736    2343336   63599400       9492       8952      92848
-/+ buffers/cache:    2241536   63701200 
Swap:     33038332          0   33038332 

在tmpfs上新建一个2G大小的文件,free命令看到"cached"增加了2GB,注意"shared"也增加了2GB:
$ dd if=/dev/zero of=/mytmpfs/testfile bs=1G count=2
+0 records in
+0 records out
483648 bytes (2.1 GB) copied, 2.42736 s, 885 MB/s
$ free
             total       used       free     shared    buffers     cached
Mem:      65942736    4423404   61519332    2106644       9088    2190064
-/+ buffers/cache:    2224252   63718484 
Swap:     33038332          0   33038332 

执行drop_caches,再观察free命令的"cached"值,发现刚才增加的2GB并未被回收:
$ sync
$ sudo sh -c 'echo 1 > /proc/sys/vm/drop_caches'
$ free
             total       used       free     shared    buffers     cached
Mem:      65942736    4430388   61512348    2106644       5284    2183096
-/+ buffers/cache:    2242008   63700728 
Swap:     33038332          0   33038332 

最后删除tmpfs上的文件,free命令看到"Cached"和"Shared"同时减少2GB:
$ rm /mytmpfs/testfile
$ free
             total       used       free     shared    buffers     cached
Mem:      65942736    2324096   63618640       9784       6228      87412
-/+ buffers/cache:    2230456   63712280 
Swap:     33038332          0   33038332

结论:
tmpfs占用的page cache是不能通过drop_caches操作回收的,tmpfs占用的page cache同时也算进了”shared”中,也就是说,被视为共享内存。

Linux kernel利用tmpfs实现共享内存(shared memory),参见:
https://www.kernel.org/doc/Documentation/filesystems/tmpfs.txt
所以共享内存也和tmpfs一样,属于page cache,但又不能被drop_caches回收。这里所说的共享内存包括:

我们通过一个实验来观察共享内存对free命令的影响。以下程序通过shared anonymous mmap方式申请256MB大小的内存:

#include <sys/mman.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>

#define MAP_SIZE 268435456

int main()
{
    char *addr;
    ssize_t s;

    addr = mmap(NULL, MAP_SIZE, PROT_READ|PROT_WRITE, MAP_ANONYMOUS|MAP_SHARED, -1, 0);
    if (addr == MAP_FAILED) {
        fprintf(stderr, "mmap failed\n");
        exit(EXIT_FAILURE);
    }
    memset(addr, 9, MAP_SIZE);

    printf("mmap done, memset done, check free output. Press any key to exit...\n");
    getchar();
    exit(EXIT_SUCCESS);
}

实验过程如下:

先回收cache,设置初始状态:
$ sync; sudo sh -c 'echo 1 > /proc/sys/vm/drop_caches'; free
             total       used       free     shared    buffers     cached
Mem:      65942736    2401684   63541052       9576       3648      54820
-/+ buffers/cache:    2343216   63599520 
Swap:     33038332          0   33038332 

然后执行我们的测试程序,申请256MB共享内存:
$ ./mmap_test
mmap done, memset done, check free output. Press any key to exit...

在另一个窗口里观察,看到cache值增加了256MB,注意"shared"也同时增加了256MB:
$ free
             total       used       free     shared    buffers     cached
Mem:      65942736    2652796   63289940     271720       6380     321760
-/+ buffers/cache:    2324656   63618080 
Swap:     33038332          0   33038332 

执行drop_caches,发现刚才新增的256MBcache值并未被回收:
$ sync; sudo sh -c 'echo 1 > /proc/sys/vm/drop_caches'; free
             total       used       free     shared    buffers     cached
Mem:      65942736    2666452   63276284     271720       3628     316532
-/+ buffers/cache:    2346292   63596444 
Swap:     33038332          0   33038332 

退出mmap_test程序,再看cache值就减少了256MB,注意"shared"也同时减少256MB:
$ free
             total       used       free     shared    buffers     cached
Mem:      65942736    2400268   63542468       9576       4796      59148
-/+ buffers/cache:    2336324   63606412 
Swap:     33038332          0   33038332

结论:cache值包含了共享内存的大小,然而drop_caches是不能回收它的。
注:上例是shared anonymous mmap,如果是SysV shared memory或POSIX shared memory,结果是一样的。

总结:为什么drop_caches操作不能回收所有的page cache?因为

作者:Linux Performance
@vmunix
原文地址:为什么手工drop_caches之后cache值并未减少?, 感谢原作者分享。

发表评论