WGCNA（1）：R包安装及数据导入清洗

2023-02-25 01:29:02Python022

WGCNA（1）：R包安装及数据导入清洗,第1张

WGCNA ：加权基因共表达网络分析，简而言之，就是将基因划分为若干个模块，探究与表型数据与基因模块之间的相关关系，并找到模块中的核心基因。

适用于复杂的数据模式，推荐5组(或者15个样品)以上的数据。一般可应用的研究方向有：不同器官或组织类型发育调控、同一组织不同发育调控、非生物胁迫不同时间点应答、病原菌侵染后不同时间点应答。

更多原理还有专业术语可以看生信技能树的帖子： https://cloud.tencent.com/developer/article/1516749

参考资料是官方说明书：

https://horvath.genetics.ucla.edu/html/CoexpressionNetwork/Rpackages/WGCNA/Tutorials/FemaleLiver-01-dataInput.pdf

这是任何网络分析的第一步。在这里展示了如何加载典型的表达数据，将其预处理成适合网络分析的格式，并通过去除明显的离群样本以及缺失条目数量过多的基因和样本来清洗数据。

请注意，每一行对应一个基因，而每一列对应一个样本或辅助信息。需要移除辅助信息，因为WGCNA针对的是基因进行聚类，而一般我们的聚类是针对样本，所以这个时候需对表达数据进行转置以进行进一步分析。

因为我的基因数目比较多，所以在这里选取差异最大的前30%进行模块构建。

如果是全部基因，那首先检查基因和样本是否有过多的缺失值。如果是Top xx%选择后的基因，那通常 gsg$allOK会返回TRUE，因为前期已经进行了选择。

如果返回值是TURE，证明所有的基因都符合要求，如果返回值是FALSE，需要去除离群值。

再次检测

由于基因数目太多，后续计算都是使用datExpr0数据集。

这里的样本有明显离群值，可以通过设定阈值去掉离群值。

现在变量datExpr包含用于网络分析的表达量数据

现在表型数据和基因表达量数据都已经成功导入，在继续网络构建之前，可以可视化样本和表型之间的关系。

最后一步是保存处理好的表达量数据和表型数据，以便在本教程的后续步骤中使用。

在使用boxplot描述数据时，离群值的存在会干扰boxplot可视化的结果。

在网上找到的解决方法为设置 geom_boxplot(outlier.shape = NA) ，并使用 coord_cartesian() 函数进行y轴的缩放。下面有一组随机数展示

这样的好处在于我们并没有舍去离群值，而是将离群值隐藏起来，并通过对y轴的缩放获得更好的可视化结果。例如，如果直接使用 ylim() 函数来调整y轴的范围则是直接移除离群值。

完。

基因数据样本表型如果

# 上一篇：你好想问你C语言用*打出A，K，M，N，V，W都怎么打考试题 555。。。

# 下一篇：go语言可以做什么

给您推荐相同类型的内容：

面试java开发工程师一般会提什么问题
1、多带几份简历前往面试没有什么能被比要求提供多一份简历，而你却没有，更能显得你缺乏准备了。多带几份简历，因为面试你的人可能不止一个，预先料到这一点并准备好会显得你做事正规、细致。2、留心你自己的身体语言尽量显得机灵、有活力、对面试主考人要
Go语言——sync.Map详解
sync.Map是1.9才推荐的并发安全的map，除了互斥量以外，还运用了原子操作，所以在这之前，有必要了解下 Go语言——原子操作go1.10srcsyncmap.go entry分为三种情况：从read中读取k
go语言可以做什么
1、服务器编程：以前你如果使用C或者C++做的那些事情，用Go来做很合适，例如处理日志、数据打包、虚拟机处理、文件系统等。2、分布式系统、数据库代理器、中间件：例如Etcd。3、网络编程：这一块目前应用最广，包括Web应用、API应用、
如何用java计算一个圆的面积和周长？
一、数学公式：圆周长=2*π*半径面积=π*半径²二、算法分析：周长和面积都依赖半径，所以要先输入半径值，然后套用公式，计算周长和面积。最终输出结果即可。三、参考代码：代码如下#include "stdio.h&qu
c语言有哪些基础知识？
C语言是一门面向过程的、抽象化的通用程序设计语言，广泛应用于底层开发。C语言能以简易的方式编译、处理低级存储器。C语言是仅产生少量的机器语言以及不需要任何运行环境支持便能运行的高效率程序设计语言。尽管C语言提供了许多低级处理的功能，但仍
ruby安装：‘D:Program’不是内部或者外部命令，也不是可运行的程序
您好，这样的：Sass的安装:1.安装：SASS是Ruby语言写的，但是两者的语法没有关系。不懂Ruby，照样使用。只是必须先安装Ruby，然后再安装SASS。假定你已经安装好了Ruby，接着在命令行输入下面的命令：gem install
Python中如何从键盘中输入字符串，统计字母，数字，符号和空格的个数？
初学者的话确实可以通过 ascii table 来判断字母和数字的区别。Python 里面有两个内置函数 ord 和 chr 可用。ascii table通过判断其字的范围来确定是字母还是别的。确实可以达到你现在想要的目的。不过我个人建议
java 两个数组剔除重复的
String[] a = { "0", "1", "2", "3", "4", "5", "6" }
java程序员有前途吗
java的就业前景还是非常好的，虽然很多人都在说java饱和了，但事实上，java运用更加广泛，而且可以被看作是一项基础来学。不论学大数据、web、全栈、人工智能、前后端，小程序都需要学java！而且当你学完java后，再学C#，pytho
c语言链条栈怎么判断满了没
因为堆栈是链式栈，是否满栈取决于堆存储的大小。堆空间耗尽时，可以狭义地理解为栈满。那么在编程时，可以用一个变量保存栈元素的个数。栈是否满，取决于申请动态内存时的返回值，如Stack*p=(Stack*)malloc(sizeof(Stack
新手关于C语言中类(Classes)的问题，求高手！
#include&ltiostream&gtusing namespace stdclass X{int x定义类X的私有实例成员变量xpublic:X() {x=0} 默认构造函数（无参数），将x初始化为0
GO语言（三十）：访问关系型数据库（上）
本教程介绍了使用 Godatabasesql及其标准库中的包访问关系数据库的基础知识。您将使用的databasesql包包括用于连接数据库、执行事务、取消正在进行的操作等的类型和函数。在本教程中，您将创建一个数据
如何在ruby中用http 发送get，post请求
本文实例讲述了python通过get,post方式发送http请求和接收http响应的方法。分享给大家供大家参考。具体如下：测试用CGI,名字为test.py，放在apache的cgi-bin目录下:#!usrbinpythonimp
R语言|绘制物种累计曲线
物种累积曲线( species accumulation curves)用于衡量和预测群落中物种丰富度随样本量扩大而增加的幅度，在生物多样性和群落调查中，被广泛用于判断样本量是否充分的并估计群落丰富度。一般而言，在样本量较少的情况下，
达内培训 java 培训多少钱
达内培训Java培训费用大概在1-3万元左右，每个人根据个人不同的基础决定学习的课程，基础差点的学习的是基础课程，费用相对低一点。【Java培训】的时间是4个月左右，具体看个人学习情况，如果学习学的好，4个月就能毕业，如果是觉得学习完了后自
如何零基础自学java?
关于java怎么学？我的建议如下：请点击输入图片描述1、按阶段规划，时间留够，但一定要有互相催促的伙伴，否则会很孤独也难以坚持，伙伴得挑好了，别把你带歪了。2、有了伙伴先学习HTML+CSS，做点网页出来，让自己心中对软件行业充满成就感
r语言怎么安装
点击进入:Windows (95 and later),再点击:base,下载SetupR.exe,约18兆,此便是R FOR WINDOWS的安装程序。双击SetupR.exe,按照提示一步步安装即可。安装完成后,程序会创建R程序组并在
Ruby学完能干什么？
Ruby作为一种通用的程序设计语言，和其它常用的编程语言一样，可以编写大部分我们日常遇到的任务，而且完成得更简单优雅。已经有人用她编写了Web服务器程序、科学计算程序、视频游戏软件和其他有趣的应用。更多的人用她来做程序原形实验和处理每天遇到
GO语言商业案例（十八）：stream
切换到新语言始终是一大步，尤其是当您的团队成员只有一个时有该语言的先前经验。现在，Stream 的主要编程语言从 Python 切换到了 Go。这篇文章将解释stream决定放弃 Python 并转向 Go 的一些原因。
GO语言入门，有什么好的教程啊？
可以学习黑马程序员的这个教程20小时快速入门go语言：网页链接go语言的优势可直接编译成机器码，不依赖其他库，glibc的版本有一定要求，部署就是扔一个文件上去就完成了。静态类型语言，但是有动态语言的感觉，静态类型的语言就是可以在编
Python篇(一) 引号的作用及其区别
这里主要记录一下在 python 中使用单引号, 双引号和三引号的区别. 当前开发环境 GitHubHowPy运行结果运行结果运行结果目前为止,是看不出来它们之间的区别的, 都是 Python 的
java的接口，类，属性，方法各有哪些修饰符
1、接口的修饰符只有：public2、类的修饰符分为：可访问控制符和非访问控制符两种。可访问控制符是：公共类修饰符 public非访问控制符有：抽象类修饰符 abstract ；最终类修饰符 final3、属性的控制修饰符也分为：可访问
Python数据分析笔记#8.2.2 索引上的合并
「目录」数据规整：聚合、合并和重塑Data Wrangling: Join, Combine, and Reshape --------&gt数据库风格的DataFrame合并
零基础如何自学java？
关于自学，先提几条建议，望采纳！找一个行业当中的师傅进行规划和指导。每天规划好学习时间，不要中断。先掌握了解知识体系后编写项目，边抓细节。俗话说态度决定一切，一个人的学习态度相当重要，而一个良好的态度不仅会提高你的效率，而且还会影响效果
R语言得到了模型，怎么预测，比如我要预测2013时候的数据
预测的话，应该用接下来的时间，所以应该是预测2014,2015....程序如下：new&lt-data.frame(year=2014)lm.pred&lt-predict(z,new,interval="p
C语言中x1是字符还是字符串
是 char y[3] = “x1”；这种写法。y必须定义成字符数组才行，而不是单纯的y，char y的话y只能是单个字符。char y[3]是定义了一个字符数组y，其中含有3个元素，元素都是char型的。也可以理解为字符串的定义方式，因为
如何辨别红刚玉
下面是能找到的关于红刚玉的知识，希望对你有些帮助。红刚玉的成分主要为α－氧化铝，也叫铬刚玉，红宝石。现在市面上多为人造红刚玉。红刚玉在白刚玉的基础增加22%的铬，经电弧炉熔炼制成，颜色呈紫红色。硬度略高于棕刚玉，与白刚玉近似，显微硬度可22
C语言数组输入。。
C语言数组输入是相同类型的、数量有限的若干个变量通过有序的方法组织起来的一种便于使用的形式。数组属于一种构造类型，其中的变量被称为数组的元素。数组元素的类型可以是基本数据类型，也可以是特殊类型和构造类型。在引用数组中的元素时，采用数组名[
R语言之—字符串处理函数
R语言之—字符串处理函数nchar取字符数量的函数length与nchar不同，length是取向量的长度# nchar表示字符串中的字符的个数nchar("abcd")[1] 4# length表示向量中元素的个数le
用c语言循环语句解决以下问题？
循环不用多，一个循环就够了，在输入的同时计算总和，统计对应数值，最后打印输出。#include"stdio.h"int main(){int i,m,flagfloat df[12],summ=0for(i=0,m=

推荐阅读

热门文章

最新发布

标签列表

WGCNA（1）：R包安装及数据导入清洗

给您推荐相同类型的内容：