随着癌症基因组学的进步,突变注释格式(MAF)被广泛接受并用于存储检测到的体细胞变体。 癌症基因组图谱项目对30多种不同的癌症进行了测序,每种癌症类型的样本量超过200种。由体细胞变体组成的结果数据以MAF格式形式存储。 只要数据采用MAF格式,该软件包就会尝试从TCGA源或任何内部研究中有效地汇总,分析,注释和可视化MAF文件.

使用前要先将文件转换为maf格式,对于VCF格式文件,可以使用 vcf2maf 进行格式转换.


注: 安装过程特别麻烦,按了好几天,R版本要求3.3以上,也不要使用最新版本,可能有的包新版本还没同步 。我使用的是:


Converts variant annotations from Annovar into a basic MAF.将annovar格式转换为maf格式

| 参数 |详细解释 |

| annovar | input annovar annotation file.|

| Center | Center field in MAF file will be filled with this value. Default NA.(MAF文件中的中心字段将填充此值。 默认NA)|

| refBuild | NCBI_Build field in MAF file will be filled with this value. Default hg19.(MAF文件中的NCBI_Build字段将填充此值。 默认hg19)|

| tsbCol | column name containing Tumor_Sample_Barcode or sample names in input file.(列名包含Tumor_Sample_Barcode或输入文件中的示例名称) |

| table | reference table used for gene-based annotations. Can be 'ensGene' or 'refGene'. Default 'refGene'(用于基于基因的注释的参考表。 可以是'ensGene'或'refGene'。 默认'refGene)|

| basename | If provided writes resulting MAF file to an output file. (将结果MAF文件写入输出文件)|

| sep | field seperator for input file. Default tab seperated.|

| MAFobj | If TRUE, returns results as an [MAF]( object.|

| sampleAnno | annotations associated with each sample/Tumor_Sample_Barcode in input annovar file. If provided it will be included in MAF object. Could be a text file or a data.frame. Ideally annotation would contain clinical data, survival information and other necessary features associated with samples. Default NULL.(与输入annovar文件中的每个样本/ Tumor_Sample_Barcode相关联的注释。 如果提供,它将包含在MAF对象中。 可以是文本文件或data.frame。 理想情况下,注释将包含临床数据,生存信息和与样本相关的其他必要特征。 默认为NULL)|


Takes tab delimited MAF (can be plain text or gz compressed) file as an input and summarizes it in various ways. Also creates oncomatrix - helpful for visualization.

该文件将每个样本中的变体数显示为堆积条形图,将变体类型显示为Variant_Classification汇总的箱形图。 我们可以在堆积的条形图中添加平均线或中线,以显示整个群组中变体的平均值/中值数

Plots maf summary.

Oncoplot函数使用“ComplexHeatmap”来绘制oncoplots2。 具体来说,oncoplot是ComplexHeatmap的OncoPrint功能的包装器,几乎没有任何修改和自动化,使绘图更容易。 侧面条形图和顶部条形图可分别由drawRowBar和drawColBar参数控制。


takes output generated by read.maf and draws an oncoplot



使用oncostrip函数可视化任何一组基因,它们在每个样本中绘制类似于cBioPortal上的OncoPrinter工具的突变。 oncostrip可用于使用top或gene参数绘制任意数量的基因

titv函数将SNP分类为 Transitions_vs_Transversions ,并以各种方式返回汇总表的列表。 汇总数据也可以显示为一个箱线图,显示六种不同转换的总体分布,并作为堆积条形图显示每个样本中的转换比例。

takes output generated by read.maf and classifies Single Nucleotide Variants into Transitions and Transversions.



还可以用函数geneCloud绘制突变基因的词云图。 每个基因的大小与其突变/改变的样品总数成比例。

癌症中的许多引起疾病的基因共同发生或在其突变模式中显示出强烈的排他性。 可以使用somaticInteractions函数检测这种相互排斥或共同发生的基因组,其执行成对的Fisher's Exact检验以检测这种显着的基因对。 somaticInteractions函数还使用cometExactTest来识别涉及>2个基因的潜在改变的基因集

maftools包 功能很强大,具体可参考:



tail -n +N Het-158-rawGATK-indel-filter.vcf | head


for i in *.vcf do sed -i '1d' $i done

for i in *.vcf do cat $i >> 11.vcf done


for i in *.vcf do perl /media/pc/disk2/annovar/convert2annovar.pl -format vcf4 $i >$i.avinput


awk 'BEGIN{OFS="\t"}{print "chr"$1,$2,$3,$4,$5,"Het-158"}' Het-158-indel.vcf.avinput > Het-158-indel.tsv


for i in *.tsv do cat $i >> all.tsv done


perl /media/pc/disk2/annovar/table_annovar.pl all.tsv /media/pc/disk2/annovar/mousedb/ -buildver mm10 -out variants --otherinfo -remove -protocol refGene -operation g -nastring NA


grep "exonic" variants.mm10_multianno.txt > exonic.mm10_multianno.txt



>var.annovar.maf = annovarToMaf(annovar = "variants.mm10_multianno.txt",Center = 'CSI-NUS', refBuild = 'mm10',tsbCol = 'Tumor_Sample_Barcode', table = 'refGene')

>write.table(x=var.annovar.maf,file="var_annovar_maf",quote= F,sep="\t",row.names=F)

>var_maf = read.maf(maf ="var_annovar_maf")

>plotmafSummary(maf = var_maf, rmOutlier = TRUE, addStat = 'median',showBarcodes = T)

>oncoplot(maf = var_maf, top = 10, fontSize = 12)