R|Affymetrix芯片分析(1)-affy

Python014

R|Affymetrix芯片分析(1)-affy,第1张

Affymetrix芯片储存着大量的生物信息学数据,因此有必要从实战出发的角度,汇总下Affymetrix芯片处理的流程。下面以GSE1438为例

常用的质量控制的指标: 平均数法、RLE、NUSE和RNA降解曲线 根据以上指标综合决定实验是否合格,并提出质量不合格的样品。

可以看出,这个芯片的整体检查率并不太高,且GSE23740、GSM23745、GSM23746、GSM23750、GSM2375和GSM23757的RLE和NUSE偏离中心太多,整体RNA降解斜率偏低。在实际科研中,我们最好寻找高质量的芯片。

考虑到整体芯片质量不佳,过滤后剩余的样本数会比较少,下面就假装质量还可以进行下游分析(请大家谅解!)

当然affy包主要针对的是旧版的Affymetrix芯片,如hgu95/95和hgu133系列。下一篇我们来看看oligo包。

参考链接:

R语言_Affymetrix芯片数据处理

用affy包读取affymetix的基因表达芯片数据-CEL格式数据

使用oligo dT引物扩增的产物, 可以保证扩增产物包括mRNA的3'末端(减少rRNA的干扰), 但是oligo dT primer扩增有一个问题, 就是扩增片段的长度和扩增产物所包含的信息量的问题, 之所以有长度这个问题,一方面和lz所提到的RNA完整性有关,但最重要的限制在于逆转录酶的延伸能力. 用oligo dT primer扩增可能出现扩增出来的片段长度短, 虽然都有mRNA的3'端, 但是序列信息多位于3'-UTR附近, 若扩增序列太短,则有用信息很少, 不利于序列的识别和分析.

使用random primer, 也有片段长度的限制, 但是由于它的逆转录并不一定在mRNA的末端起始, 而是在随机位置起始,所以它的扩增片段带有更多CDS的信息.但是如果是用总RNA逆转录的话,有可能会受到rRNA的干扰.

至于Gsp,只是在扩增已知gene/gene family以及部分原理的RACE中使用.

如果接下来你的PCR产物是外显子,就用oligo dT

如果是内含子或者包括部分内含子,就用random;

1 随机6具体引物:当特定M RNA含有使反转录酶终止的序列而难合成全长时可采用随机6具体引物来拷贝M RNA。用此引物合成的C DNA96%源与R RNA

2 oligo dt :是一种对M RNA 特异的方法,因决大多数真核生物M RNA都有 POLY A结构,故仅M RNA被转录。做RT一般都用他做引物,特异性较强。

3 特异性引物:用含目标RNA的互补序列寡核甘酸做引物,可导致更为特异的扩增长物。