转录组分析中—用R语言画带基因名标签的PCA主成分分析图

Python024

转录组分析中—用R语言画带基因名标签的PCA主成分分析图,第1张

 

 

1. “PCA.data.txt”基因表达值矩阵。其中第一列为基因名称,这里以ensembl id作为指代;其余各列记录了RNA-seq获得的各基因在各样本中的表达量信息。

2. “group.txt” 则为样本分组文件,记录了样本所属的不同分组。

那个最佳答案说的跟这个问题没有关系。我在学习r语言的线性回归的时候遇到了这个问题。这个图是用来判断你对回归模型的线性假设是否成立的。看法如下:

按照书上所说就是:“

若图形存在非线性,则说明你可能对预测变量的函数形式建模不够充分,

那么就需要添加一些曲线成分,比如多项式项,或对一个或多个变量进行变换(如用log(X)代

替X),或用其他回归变体形式而不是线性回归。

按照别人的说法就是:看图中的两条线,红色虚线和绿色实线是否接近。接近了就说明模型是线性的(这是在RStudio中做出的成分残差图)。