R成精系列-如何用R语言画出精美的图形

Python023

R成精系列-如何用R语言画出精美的图形,第1张

色彩是一门重要的艺术语言。

在不同的领域,色彩都以其扑面而来的色感,带给人们直观的生理和心理感受,产生想象和联想。

R语言无与伦比的绘图系统能够产出精美的图,如何构造精美的图片,色彩起着举足轻重的作用,良好的配色往往在图表中起到点睛的作用。

但往往都是别人的图很精美,自己画的图则丑得哭。

希望通过本文能够提升R语言的色彩的基本运用,如果看完做的图任然很丑,那就是审美的问题,可以找个美术老师补习一下审美的知识。

初中物理课我们大概都做过棱镜实验,白光通过棱镜后被分解成多种颜色逐渐过渡的色谱带,颜色依次为红、橙、黄、绿、青、蓝、紫,这就是可见光谱,对啦,彩虹就是光色散的现象。

而色彩的混合模式分为:

红、绿、蓝三种色光无法被分解,故称“三原色光”,因此将红(R)、绿(G)、蓝(B)三色作为色光三原色。可见光谱中的大部分颜色可以由三种基本色光按不同的比例混合而成,色光三原色被广泛应用于电视机、监视器等主动发光的产品中。

由于颜料本身是不发光的,我们之所以看到颜料的各种颜色是光源照射到颜料后,被颜料吸收部分色光后反射的一部分色光。因此颜料三原色是色光混合原理的延伸,它是色光做在做减法,所以亦称为减法三原色。青色、品红、黄色三种颜料两两混合能产生其他各种颜色,所以把青色、品红、黄色称为颜料三基色。颜料三基色的混色在绘画、印刷中得到广泛应用。

palette()调色板

colors()生成R的颜色

rgb()生成颜色编码

col2rgb()将颜色转为rgb色值。

rgb2hsv(col2rgb("blue"))

R自带的grDevices包有如下6个调色板,传入获取颜色的个数,就获得相应个数的颜色列表,gray()的参数需在[0,1]。

当我们不知道怎么配色,或者怎么配色都不好看的时候,可以直接用别人定义好的主题是最方便的做法,你只负责出图,颜色的事情交给专业的人士来处理。

ggthemes包中的色彩方案都是打包好,命名过的,所以我们引用的时候,只需赋值即可。

在使用ggplot的过程中可使用的就比较多。

增加Viridis 色带

RColorBrewer

GGSCI

www

查看支持的色板

系统会自动生成你想使用的颜色,不用一个一个单独设置,非常方便。

使用centWave算法对centroid模式的高分辨LC-MS进行色谱峰检测。centWave算法最适用于高分辨率 centroid模式 的LC/{TOF、OrbiTrap、FTICR}-MS数据。在第一阶段,该方法确定了感兴趣区域(ROI),这些区域代表了LC/MS连续扫描时小于ppm m/z偏差的质量轨迹。 详细地说,从单个m/z开始,如果在下一次扫描(频谱)中发现的m/z,其与平均m/z的差异小于用户定义的m/z的ppm,则合并为一个ROI。 考虑到新加入的m/z值,ROI的平均m/z值也随之更新。

此时dda_data多了msFeatureData属性,检测到的色谱峰信息储存在

dda_data@msFeatureData[["chromPeaks"]]

共检测到111个一级质谱,将检测到的离子可视化

上图中一条线代表一个离子,线的长度代表峰宽,宽度代表质荷比m/z的范围。

也可以画成散点图

或者ggplot2出图

途中可以看到许多重叠的点,说明这些离子具有相似甚至相同的保留时间和质荷比。

合并伪峰和重叠峰

expandRt将保留时间窗口向两边扩展多少秒,

expandMz,将每个色谱峰的m/z范围扩大(两边)。

minProp, 数值在0-1之间,表示峰连接所需的强度比例。 默认(minProp = 0.75)表示只有当信号的中间部分大于两个峰值的“maxo”(峰值顶点的最大强度)中最小值的75%时,峰值才会连接。

111个峰合并为55个。

合并前后对比

共检测到122个二级质谱,有些色谱峰没有二级质谱,如CP001,有些色谱峰又有好几个二级质谱,如CP002。

参考资料:

https://bioconductor.org/packages/release/bioc/html/xcms.html

LCMS data preprocessing and analysis with xcms (bioconductor.org)

根据塔板理论,有效理论塔板数n有效是衡量柱效能的指标,表示组分在柱内进行分配的次数,但样品中各组分,特别是难分离物质对(即物理常数相近,结构类似的相邻组分)在一根柱内能否得到分离,取决于各组分在固定相中分配系数的差异,也就是取决于固定相的选择性,而不是由分配次数的多少来确定。因而柱效能不能说明难分离物质对的实际分离效果,而选择性却无法说明柱效率的高低。因此,必须引入一个既能反映柱效能,又能反映柱选择性的指标,作为色谱柱的总分离效能指标,来判断难分离物质对在柱中的实际分离情况。这一指标就是分离度R。分离度又称为分辨率。