【原创】R语言实战：read counts如何转化为TPM和FPKM, TPM和FPKM相互转化

2023-02-26 19:48:02Python010

【原创】R语言实战：read counts如何转化为TPM和FPKM, TPM和FPKM相互转化,第1张

mycounts<-read.csv("2020武汉加油.csv")

head(mycounts)

rownames(mycounts)<-mycounts[,1]

mycounts<-mycounts[,-1]

head(mycounts)

kb <- mycounts$Length / 1000

countdata <- mycounts[,1:9]

rpk <- countdata / kb

rpk

tpm <- t(t(rpk)/colSums(rpk) * 1000000)

head(tpm)

write.table(tpm,file="2020武汉加油_tpm.xls",sep="\t",quote=F)

fpkm <- t(t(rpk)/colSums(countdata) * 10^6) （之前这里写成了10^9，多谢@不爱说话的生物狗提醒，现在已经修改）

head(fpkm)

write.table(fpkm,file="2020武汉加油_fpkm.xls",sep="\t",quote=F)

fpkm_to_tpm = t(t(fpkm)/colSums(fpkm))*10^6

head(fpkm_to_tpm)

当然，已知所有基因的FPKM情况下，可以通过上述公式直接在excel里计算相应基因的TPM值。

获取表达矩阵，处理TCGA的count数据，1表示为行。

导入数据

加 ENTREZID列，用于富集分析（symbol转entrezid，然后inner_join）

转化空格为NA

用花花的专属TCGA包，ID进行转换

把空着的值改为NA

以病人为中心，表达矩阵按病人ID去重复

去除重复

TPM数据做单个基因的生存分析file:///C:/Users/denghuan/Desktop/The%20learning%20of%20R%20software/Practice/%E7%94%9F%E5%AD%98%E5%88%86%E6%9E%90%20survival%20analysis/6.Survival.html

stringr::str_replace_all()

str_detect(colnames(exp),"TCGA-W5-AA2R")

在用 featureCounts 做完表达矩阵的counts值后进行TPM需要注意这个细节问题，在计算TPM时每个基因需要除以各自的基因长度来校正基因长度，每一个样本又要除以它各自的文库大小校正测序深度。

因此，我们的表达矩阵，其实是需要除以两个长度不一的向量，而且方向不一样，一个是按照行来除以（基因长度），一个是按照列来除以（测序深度），在我之前的文章 https://www.jianshu.com/p/cd1c7b4ec6a2 RNA-seq数据分析一：(HISAT2+featureCounts） 中有提到

count 是表达矩阵，kb是不同基因长度向量，而 colSums(count) 是不同样本的长度向量。

矩阵除以向量，是按行的顺序来的，如果需要按列的顺序来(不同样本，一列一列)，就得先转置，再转回来

我们可以看到，一个矩阵除以向量是将向量按照行（第一行第一个，第二行第一个...）的顺序与矩阵中的数据相除。

矩阵向量基因长度数据

# 上一篇：JAVA和Python有啥区别？

# 下一篇：C语言试题及答案(2)

给您推荐相同类型的内容：

java怎么调用方法？
对象调方法class A{public void Out()方法{System.out.println("a")}public static void main(String[] agrs){A a
现在学java好还是.net好？
Java更好一点，因为Java应用广泛，除非有一项很大的技术突破能够替代Java。在当下，Java被使用的场景非常多，网站、游戏、办公软件、新零售、云计算、芯片技术、数字经济等多个互联网领域都不开Java，拥有很好的就业前景。就算是小白也可
如何用rstudio制作r语言包
有点复杂啊。。。这么短讲不清楚。。。我写的仅供参考，以R官网的说法为准。一般先点右上角新建一个project（一般是new directory），类型是package，其他设置看自己喜好啦。然后要填写DESCRIPTION，比如作者、概述、
自律的重要性（阐述了自律的重要性）
假如在网络上，有人陪着你一起“云自习”，你愿意和他一起专注的学习吗？这件事情看上去挺无聊的，但在油管上，真的有很多人通过这种方式提高了学习成绩。学霸的带动作用是难以想象的，自律不仅可以让自己离成功更近，也可以感染他人。给大家推
JAVA 中的 -> 是什么意思？
“-&gt”是Java 8新增的Lambda表达式中，变量和临时代码块的分隔符，即：(变量)-&gt{代码块}如果代码块只有一个表达式，大括号可以省略。如果变量类型可以自动推断出来，可以不写变量类型。运算符是一元、二元还是三
golang比java好，会取代java，你们认可吗？
Go和java产生的背景和语言的定义不一样，比较他们的好坏没多大意义，适合就是最好的，当你去做一个大型的项目的时候，使用java能够更清晰地展示出你的业务。自身提供了比较完善的库。Go语言也有面向函数和面向对象的变成方案，其自身的性能决定了
JAVA的意思
Java是一门面向对象编程语言，不仅吸收了C++语言的各种优点，还摒弃了C++里难以理解的多继承、指针等概念，因此Java语言具有功能强大和简单易用两个特征。Java语言作为静态面向对象编程语言的代表，极好地实现了面向对象理论，允许程序员以
go语言一串json 如何转换成struct
使用encoding包中json文件中的marshal和unmarshal函数来序列化和反序列化即可。举例：var jsonStr string= "{xxxx}"var user *Usererr = json.Un
怎么用gpu跑r语言代码
用BLAS库进行。现在做的DNN、CNN都是在底层把计算转换为矩阵乘法。加速矩阵乘法就是用的BLAS库。很多情况下，application叫做R standard interface，就是单线程实现的矩阵乘的库，可以很容易地把这个库替换下面
python两个日期差了多少天
import datetime#首行输入，导入模块date1=datetime.date(year,month,day)#这里面year,month,day是代表年，月，日，年必须写成2021这种格式，都必须写成数字date2=dateti
r语言线性回归一定要数据框吗
r语言线性回归一定要数据框吗有两个向量，x和y，其中是成对的观察：(x1, y1), (x2, y2), …, (xn, yn)。你觉得两者间有某种线性关系，想构建两者间的回归模型。二、解决方案用lm函数做线性回归，得到系数：代码&
Go语言中的结构体
作为C语言家族的一员，go和c一样也支持结构体。可以类比于java的一个POJO。在学习定义结构体之前，先学习下定义一个新类型。新类型 T1 是基于 Go 原生类型 int 定义的新自定义类型，而新类型 T2 则是基于刚刚定义
C语言输出任何指定位数字字符
#include&ltstdio.h&gtint aa(int a,int b){int i,cfor(i=1i&lt=bi++) {c=a%10a=a10 } printf(&q
r语言ggbio包使用方法
第一步：获取要绘图的整洁数据（涉及到数据整洁和操作的知识）第二步：整洁数据做映射操作，确定x,y,color,size,shape,alpha等第三步：选择合适的几何对象（根据画图的目的、变量的类型和个数）第四步：坐标系和刻度配置第五步：标
有什么好玩的C语言小程序
一个“歼灭敌机”的小游戏，DEVc++编译通过：#include &ltstdio.h&gt#include &ltconio.h&gt#include &ltstdlib.h&gt#
深入理解python中的排序sort
进行一个简单的升序排列直接调用sorted()函数，函数将会返回一个排序后的列表：sorted函数不会改变原有的list，而是返回一个新的排好序的list如果你想使用就地排序，也就是改变原list的内容，那么可以使用lis
帮忙取名
李艺伟李腾敏李瑞源李羸尔李宗安李逸滟李芯奇李泽瑜李将之李若愚李梅芸李静雨李玙熹李祥虎李奇芮李熙武李庭萱李智慧李栩华李佳晴李根华李凌云李皑茏李欣潼李志然李卫李晨杨李芊芊李杜李隐西李桂云李楷钜李博韬李湍钿李月李枷懿李翊凡李志先李温李晴李伟业李成
java 中|| 和 && 这类的符号都表示什么？
&amp&amp和||是一种逻辑运算符，&amp&amp是逻辑与，当两个数都为真，则结果为真。||是逻辑或，两个数任意一个为真，则结果为真。举个例子：1、a &amp&ampb当a、b都
c语言如何把c程序编译成可执行的exe文件
所需工具材料：c语言编辑工具（如vc6.0）编译生成.exe可执行文件，并保存的步骤如下：打开c语言编辑工具（vc6.0）,写入所编程序源代码。点击组建-编译-执行执行完程序，点击回车点击文件另存为把文件存到你能够找到的文件夹
用C语言实现保龄球的积分程序。希望高手能够详细解答，谢谢，感激不尽！
额，时间不太够，只能写一部分代码，然后给你思路了，先抱歉。下面是代码：#include&ltstdlib.h&gtstatic int a[1000] = {0}main(){int ifor(i = 0i&lt10
R语言排序函数
sort（）是对向量进行从小到大的排序 rank（）返回的是对向量中每个数值对应的秩 order（）返回的值表示位置，依次对应的是向量的最小值、次小值、第三小值......最大值rank() sort() order() 和
如何用c语言读取图片
#includeusing namespace std#define Twoto1(i,j,w) i*w+jvoid createimage(unsigned char *&ampimg, int w, int h){img
python中的pass代表什么意思呢?
pass就是什么也不做，只是为了防止语法错误。知识扩展：1、Python是一种面向对象、直译式计算机程序设计语言，由荷兰人Guido van Rossum发明于1989年，1991年发行第一个公开发行版。2、它常被昵称为胶水语言，它能
R语言包安装成功但使用不了怎么办
R是不断更新的一个工具,里面的扩展包的使用是和R的版本还有byte相关的,所以这里根据你的报错信息来看, 你要检查一下你的R版本,保证在3.2以上能够使用这个扩展包.R里的复杂扩展包一般都是有依赖包存在的,一般使用install.pack
python模拟鼠标点击可以唤醒吗
python模拟鼠标点击可以唤醒的。用python做一个鼠标模拟点击器,可以实现多位置,定时,定次数,定区域随机位置点击,对于一些比较肝的游戏(痒痒鼠之类的),挂机非常有帮助,解放双手定区域随机点击可以一定程度上防止系统检测出有使用脚本开挂
面试问题总结（一）Golang
使用go语言的好处: go语言的设计是务实的, go在针对并发上进行了优化, 并且支持大规模高并发, 又由于单一的码格式, 相比于其他语言更具有可读性, 在垃圾回收上比java和Python更有效, 因为他是和程序同时执行的.1.
su的ruby控制台不知道去哪了
控制面板里。打开su，在上方控制面板里面找到视图，点击视图，找到第一个大工具集，勾选大工具集。然后点击确定，回到界面就可以看到左侧的控制面板被调出来了。控制台是指控制室内的专业家具。控制面板，Windows图形用户界面的一部分。《龙在江湖》
基于C语言堆栈push,pop,destroystack,isEmpty,isFull实现
以下代码是基于C语言写的堆栈的压栈，出栈，清栈，读栈指针等方法，在Visual studio 中，可直接使用，供学习者参考学习。 #include#include#include#include
Java里的每个符号代表什么意思
你好提问者：算术操作符一元： + - ++ --二元： + - *% 值得注意的是 ++ 和-- 操作符，如：int a，x=1，y=5；a = ++x；b=y++；此时a的值为2（先加1，后赋值
python字符串前面加r的问题，不会影响d这个转义字符
刚开始学python，遇到一个字符串前面加r的问题理论上，字符串前面加r，会消除转义字符对字符串的影响例： s=r'tt' print(s) Output: 'tt's

推荐阅读

热门文章

最新发布

标签列表

【原创】R语言实战：read counts如何转化为TPM和FPKM, TPM和FPKM相互转化

给您推荐相同类型的内容：