用R语言对vcf文件进行数据挖掘.2 方法简介

2023-02-23 12:23:02Python013

用R语言对vcf文件进行数据挖掘.2 方法简介,第1张

vcfR 可以直接读取vcf格式的数据。如果同时读取参照序列fasta格式的序列文件和gff格式文件的注释文件还可以获取更完整的信息(此步骤并非必须，可以只读取vcf数据)。在此处便于重复用到了 pinfsc50 包。这个包里是植物致病微生物的基因序列测序结果。包含了一个vcf文件，一个fasta文件和一个gff文件。

这里用到参照序列的数据。

当这些数据被读取到内存的时候就可以开始对染色体名字或者其它一些东西进行修改了。由于 vcfR 更擅长对的单独染色体进行分析，所以当你的基因过大或者有很多样本的时候，建议对数据进行拆分。

读取完数据以后就可以建立 chromR ，来对数据进行详细的分析。

首先对数据进行初步的可视化,

我们在上面的图里得到很多信息，比方说测序深度(DP)的峰在500，但是拖着尾巴，这个尾巴表示数据里包含着CNV信息。然后比对质量(MQ)的峰值在60,于是我们可以以60为中心对数据进行过滤。

使用 masker 可以对数据进行过滤标记。然后可视化过滤以后的数据。

是不是顺眼多了。当然我们也可以看一下SNP的分布情况。注意右下角的图。

用 chromoqc() 可以对数据进行更完整的可视化。包括外显子内含子的分布，GC含量的分布等等。

最后可以用函数 write.vcf() 把数据输出成新的vcf文件。

训练的时候。test数据肯定是不参与，所以默认情况下是NULL，但是加入test数据过后，比如说我已经对train数据迭代了一次了，也就是遍历了一次train的数据集合，这时候，可以测试一些test数据，看看这个模型在test上面的效果怎样。收敛的MLP过程下，每一次迭代整个数据集过后，在test数据集上面的错误率应该是逐渐减少的。所以，我感觉test数据其实就是为了测试当前训练好的模型的效果。

数据文件序列染色体所以

# 上一篇：c语言矩阵怎么写？

# 下一篇：怎么查自己家电脑的宽带账号

给您推荐相同类型的内容：

我是计算机专业学生。准备到大四考研的来着。一开始准备报考苏大的。但是看了下苏大考的是c语言。但我准
毫无疑问是先C，一般都是C精通了之后再继续深造java、C++或者其他的，我现在也再学C，是看视频学的，我现在正在看的是夏老师的，感觉还不错，比较适合像我这样0基础的。这个比较吸引我的地方就是讲的一听就能听懂。而且很多概念都有形象的比喻，例
c语言标识符命名规则是什么
C语言的标识符一般应遵循如下的命名规则：1、标识符必须以字母a~z、A~Z或下划线开头，后面可跟任意个（可为0)字符，这些字符可以是字母、下划线和数字，其他字符不允许出现在标识符中。2、标识符区分大小写字母。3、标识符的长度，c89规
set.seed()设置种子到底是啥作用？
R语言中set.seed()作用是设定生成随机数的种子，目的是为了让结果具有重复性，重现结果。注：set.seed(1000)，不是运行1000次，而是把种子设置为1000。那么问题来了：设成100呢，1呢？有什么区别？（见下面
Python数据分析案例-药品数据分析案例
1、串联比较2、串联函数调用3、复制列表4、字典获取元素值5、按值排序字典6、 For Else7、列表转换为逗号分隔的字符串8、合并字典9、寻找列表中最大和最小元素的索引若有不明白的地方，请移步Python视频教程
把C语言代码转成Java代码
package disimport java.io.*import java.math.*public class dis{public static void main(String [] s) throws Exception{Floa
如何用R语言在数据中提取指定列数据，并且形成一个新的数据表
1、分析数据表：通过浏览“入库明细”表，我们可能看到入库明细表中，作为提取记录的条件零件号在A列。需要提取的记录，入库日期在H列、入库单号在O列、最后生产批号在L列、入库前库存数在Q列。为DC000496ZL的记录有5条（截图中的4条是指上
在java中什么是强制类型转换！
1 ) 整数 int 转换成字串 String , 有三种方法 :String s = String.valueOf(i)String s = Integer.toString(i)String s = "" + i2
怎样删除电脑开机账户？
进入控制面板后再点更改用户类型在这里选择要删除的账户然后再点击删除账户是否保存这个账户在本机上的相关资料，删除还是保存看自己的实际情况而定。确认删除这个账户。如果用户的配置文件比较多则点删除后需要等持的时候比较长问题一：如何删除电脑用户？
让伤口变成你的铠甲
糖糖和大了自己脚丫好几码的泥泞脚印比了比，快步追上师傅慧剑。 “师父师父，糖糖什么时候可以长大呀？” “这个嘛，有的人长大只在一瞬间，有的人一辈子都......” 正说着，认真听讲没有看路的糖糖摔了一跤。看到糖糖摔到的慧剑话风一
go语言可以做什么
1、服务器编程：以前你如果使用C或者C++做的那些事情，用Go来做很合适，例如处理日志、数据打包、虚拟机处理、文件系统等。2、分布式系统、数据库代理器、中间件：例如Etcd。3、网络编程：这一块目前应用最广，包括Web应用、API应用、
用R语言，怎么合并两组数据
如果空的地方用NA 表示的话，那么就可以用如下编码实现假设第一组数据是 a1 第二组数据是a2, 他们的行数是一致的！index&lt- is.na(a1)a1[index] &lt- a2[index]# here
电脑上怎么安装声卡驱动？
1、首先双击打开驱动人生，在软件首页点击“立即体验”按钮。2、这时软件会自动搜索电脑当中各种硬件的驱动程序，有问题的驱动会在硬件名称后边提示。我们找到声卡那一个条目，点击它的版本号旁边的蓝色小三角，如图。3、小三角处会展开声卡的有效驱动程序
python属性重新赋值叫什么
python属性重新赋值叫就是在类obj 生成对象A 的时候，进行初始化，自动调用了obj 的init函数，声明了一个对象A的私有变量，并对其赋值。这时候的A.a就是访问了一个对象的私有变量。对其赋值，没有调用任何其他方法，和b=“test
安装java解压缩核心文件失败怎么办
java压缩文件解压失败java压缩文件解压失败_java安装解压缩核心文件失败第一步：下载 JDK从 SUN 网站下载 JDK6 或以上版本，这里以 jdk-6u2-windows-i589-p 版为例。第二步：安装 JDK(1)：双击
「测试开发全栈化-Go」(1) Go语言基本了解
作为一个测试，作为一个测试开发，全栈化+管理是我们未来的发展方向。已经掌握了Java、Python、HTML的你，是不是也想了解下最近异常火爆的Go语言呢？来吧，让我们一起了解下。Go 是一个开源的编程语言
go语言抓包工具有哪些官网
go语言抓包工具的网站：1，sql2go网。用于将 sql 语句转换为 golang 的 struct. 使用 ddl 语句即可。例如对于创建表的语句: show create table xxx. 将输出的语句，直接粘贴进去就行。
R语言问题，显示错误为：错误: 意外的'}' in "}"
# 看了一下楼主的编码，我的理解是把美国的hotdog 标记出来，修改如下： for(i in 1:length(hotdogs$Country)){ if(hotdogs$Country[i]=="Uni
python中集合的表述方式
解决集合出现下划线“function can call be replace with set literal”的问题集合的三种创建方式： &gt&gt&gtdef f(): return set(
C语言程序设计猜单词怎么做
你要实现的是什么功能，我理解是。你从文件里面读取一个单词到内存中，然后你输入单词与之想比较，然后相同提示正确，不相同不提示。第一：写一个文件流，读取你保存到电脑上的txt文件到内存中，并且存入一个数组中。第二：get你猜的单词，然后与之比较
我想问问电脑上如何用wps发送文件
电脑上wps发送文件的方法是：1、首先点击想要发送的文件，点击页面上的分享；2、其次点击页面下面的以文件发送；3、然后在页面上选择发送对象即可。WPS是由金山软件股份有限公司自主研发的一款办公软件套装，可以实现办公软件最常用的文字编辑、表格
如何用python制作个人简历
程序员的简历，一般通过Markdown或LaTex生成PDF，比较特别的是前端程序员会用JavaScript实现更加炫酷的网页版本简历。作为一个Python程序员，可以通过下面的代码，在命令行生成一份独一无二的Pythonic的简历。1
Go语言的开源项目
1．Docker项目网址为 https:github.comdockerdocker 。介绍：Docker是一种操作系统层面的虚拟化技术，可以在操作系统和应用程序之间进行隔离，也可以称之为容器。Docker可以在一台物理
美团dba 用啥语言开发
服务端可以使用java开发、python开发、php开发都可以。目前这三种语言也是主流的选择，就语言本身的性能来说java能稍快一点，但是开发周期java也要长一些。安卓端使用的是java语法开发，但是并不是在JVM下运行，google只是
《Go程序设计语言中文版》pdf下载在线阅读全文，求百度网盘云资源
《Go程序设计语言中文版》百度网盘pdf最新全集下载:链接：https:pan.baidu.coms1K2XHYlNbRyQMiBkckaPr7A?pwd=0cii 提取码：0cii简介：本书由《C程序设计语言》的作者Kernig
C语言中字符切割函数split的实现
#include &ltstdio.h&gt#include &ltstring.h&gt 将str字符以spl分割,存于dst中，并返回子字符串数量int split(char dst[][80], c
Python的函数都有哪些
【常见的内置函数】1、enumerate(iterable,start=0)是python的内置函数，是枚举、列举的意思，对于一个可迭代的(iterable)可遍历的对象(如列表、字符串)，enumerate将其组成一个索引序列，利用
java中对文件名的读取
多看看api1.先通过file类获取文件名列表filename[]2.通过string类对文件名进行分析处理，例如用inti=filename.indexOf("_"),然后截取subString(0,i)或者Strin
golang如何构造http.ResponseWriter和http.Request
在做测试的时候，需要模拟HTTP server的handle函数直接调用: 就不用通过发送curl命令，而是直接调用handler函数的方式；这样就需要手动构造出一个http.ResponseWriter和http.Request，然后
C语言中什么时候0表示真，1表示假
C语言规定1为真(TRUE)，0为假(FALSE)。C语言中0为假，1为真，逻辑与和整数乘法相同，而c语言中的1就是整数，整数除法12结果也会是整数，数学中答案是0.5，但是整型的不能保存0,5。因此会直接变成0。后面的计算结果是什么就
怎么查自己家电脑的宽带账号
查看方法如下：1.按“windows+x”键调出菜单选择“控制面板”；2.点击“网络和Internet”；3.然后点击“Internet选项”；4.弹出窗口，点击“连接”；5.双击“宽带连接”；6.弹出窗口，在下方用户名处即可查看到自己的

推荐阅读

热门文章

最新发布

标签列表

用R语言对vcf文件进行数据挖掘.2 方法简介

给您推荐相同类型的内容：