用R语言对vcf文件进行数据挖掘.2 方法简介

2023-02-19 22:25:02Python019

用R语言对vcf文件进行数据挖掘.2 方法简介,第1张

vcfR 可以直接读取vcf格式的数据。如果同时读取参照序列fasta格式的序列文件和gff格式文件的注释文件还可以获取更完整的信息(此步骤并非必须，可以只读取vcf数据)。在此处便于重复用到了 pinfsc50 包。这个包里是植物致病微生物的基因序列测序结果。包含了一个vcf文件，一个fasta文件和一个gff文件。

这里用到参照序列的数据。

当这些数据被读取到内存的时候就可以开始对染色体名字或者其它一些东西进行修改了。由于 vcfR 更擅长对的单独染色体进行分析，所以当你的基因过大或者有很多样本的时候，建议对数据进行拆分。

读取完数据以后就可以建立 chromR ，来对数据进行详细的分析。

首先对数据进行初步的可视化,

我们在上面的图里得到很多信息，比方说测序深度(DP)的峰在500，但是拖着尾巴，这个尾巴表示数据里包含着CNV信息。然后比对质量(MQ)的峰值在60,于是我们可以以60为中心对数据进行过滤。

使用 masker 可以对数据进行过滤标记。然后可视化过滤以后的数据。

是不是顺眼多了。当然我们也可以看一下SNP的分布情况。注意右下角的图。

用 chromoqc() 可以对数据进行更完整的可视化。包括外显子内含子的分布，GC含量的分布等等。

最后可以用函数 write.vcf() 把数据输出成新的vcf文件。

容易遇到的问题：

1.在导入文件时，可能会出现第一列列名为“X.U.FEFF.xx”。这可能是文件类型或编码方式导致，本人解决方法是将csv（utf-8）文件另存为csv文件。“X.U.FEFF.xx”字样消除。

2.在数据合并时参数type=“full”容易导致数据合并不成功。

参考网站： http://blog.sina.com.cn/s/blog_46d621c00101l66x.html

code

#先将默认目录设置到specdata下

files.name=list.files(pattern="csv")#读入目录下所有csv文件

files.length=length(files.name)#文件数，按题意为332

newdata=numeric(0)#用于存放所有sulfate数据

for(i in 1:files.length){

tmp=read.csv(a[i],head=T,sep=",")#csv文件一个个的读取

newdata=rbind(newdata,tmp[,2])}#每个文件的第2列，也就是sulfate数据，按行合并

m=mean(newdata)#计算结果

数据文件序列染色体就可以

# 上一篇：如何在电脑上抢红包

# 下一篇：自动化测试学什么语言

给您推荐相同类型的内容：

电脑如何实现直接打开网页？
不管你用的是何浏览器——去浏览器选项里面找到设置一下即可。x0dx0a搜狗高速浏览器里面的是右上角“工具”===“搜狗高速浏览器选项”===“标签设置”===“点击链接打开的标签页”，选择“在前台打开”即可。x0dx0a360安全浏
Go 语言极速入门13 - 实战项目之并发版爬虫
爬取器 fetcher 和解析器 parser 与之前相同，模型类也不变。注意：见本小节文末分析。 Q1. 为什么在 scheduler 中每一个将 Request 添加到 chan 的任务都开启一个 Goroutine 来
这个武器是什么游戏或动漫里的？
RWBY 小红的镰刀啊新月玫瑰（还可以变成枪形态）。出自RWBY 美国出的日系风格的3D网络动画。有改编游戏（3DM或者游民星空就有）其设计源于美国出产的巴雷特M82A1狙击步枪，作为威力巨大的反器材武器，其致命性和威力深受美
pythonint转换成c_uint
Python中的int类型可以转换为C语言中的uint类型，可以通过使用C语言的函数来实现。具体的实现方法如下：1. 首先，在Python中，可以使用int()函数将int类型转换为uint类型，如：int_val = int(uint_v
python如何创建空集合
python里面的集合叫做列表，有两种代码list=[]或者list=list()不用去规定数据类型更多知识可以去百度“python列表的使用”也可以直接看看这个文章python列表python 中list，tuple，dict
js里面$是什么意思
js中的$是使用在使用jQuery的函数。大多数时候用作jQuery对象或Zepto对象命名表示，比如：Jquery("body")选中了bodyDOM节点；$("body")也可以用这
新手如何选购笔记本电脑
1.第一，根据自己的需求选择。有人买电脑是为了玩游戏，有人买电脑是为了工作，有人买电脑只是为了上网看电影和综艺，有人买电脑是为了下载大型办公软件和视频软件，所以你需要明确自己的需求再去购买。2.选择笔记本类型。不同的笔记本有不同的尺寸，包括
如何检查电脑主板好坏呢？
1、一般大部分主板接通电源后，就算没有开机，主板上面的指示灯也会亮起，如果没有亮起，首先查一查是否为电源连接或者是电源自身的问题。2、尤其是主板24Pin接口以及CPU供电线接口，一定要插牢固。短接电源无需通过主板开机就能让电源运转，这同
难忘的人作文
在平凡的学习、工作、生活中，大家总少不了接触作文吧，作文要求篇章结构完整，一定要避免无结尾作文的出现。还是对作文一筹莫展吗？下面是我为大家收集的难忘的人作文，欢迎阅读，希望大家能够喜欢。难忘的人作文1在我们的生活中，总会有形形色色
电脑的麦克风在哪里设置
步骤如下：1、首先，点击电脑左下角的“开始”，点击“设置”。2、然后，找到“系统”，并点击它。3、接下来，点击左边的“声音”，再点击右边的“声音控制面板”。4、然后，点击“录制”。5、接下来，找到“麦克风”，并点击它。6、最后，设置麦克风
R语言--字符处理（stringr包）
stringr 包中的大部分函数具有统一风格的命名方式，以 str_ 开头，正则表达式也完全适用该包。字符串拼接函数 str_c ，与R语言自带的 paste 和 paste0 函数具有相同的作用。字符计数函数 str_coun
老年人用什么样的平板电脑
老年人在选择平板电脑时候，应该从自己使用的手机系统考虑，再根据经济能力选择适合自己的平板电脑。我们在选择平板电脑时候，很多人都会跟风地选择iPad，但对于老年人来说则并不适合；对于老年人来说，他们想拥有的是一台适合自己的平板电脑而不是一台“
这个人物是谁出自哪个动漫
人物名字叫做Red Trailer出自RWBY。是一部美国动漫。这是关于这个人物的资料：RWBY预告片之红是Rooster Teeth工作室在2012年11月5日公布的预告片。在这部预告片中，我们可以看见手持巨大枪镰新月玫瑰（Crescen
GO语言（十三）：使用 Go 和 Gin 开发 RESTful API（下）
当客户端在发出POST请求时albums，您希望将请求正文中描述的专辑添加到现有专辑数据中。为此，您将编写以下内容：1、编写代码a.添加代码以将专辑数据添加到专辑列表。在此代码中： 1）用于Con
在python中=和==的区别
python中“=”是赋值的意思；“==”是用于判断是否相等；相等，那么就返回“true”；不相等的，那么就返回“false”。们之间的区别就是代表的含义有所不同。一个等号代表的含义是赋值，将某一数值赋给某个变量，比如a=3，将3这个数值
制作excel表格需要下载什么软件？
制作excel表格需要下载什么软件？ office我想做个表格，应该下载个什么软件？用excel或wps中带的excel，我是word也可以电脑上制作表格需要下载软件吗？要的话是哪些？下载WPS或Office办公软件
CSS入门知识-图片水平对齐技巧
CSS入门知识-图片水平对齐技巧在CSS中，图片怎么水平对齐，有哪些技巧呢？我们一起来学习一下吧！一、图片水平对齐text-align在“文本水平对齐text-align”这一节我们详细讲解了text-align属性
CSS 如何禁止标签<a>的继承
吧 A标签的 class 名称设置的一样然后在css文件中或者head上的 css代码中设置实例：&lta href="#" class="a1a2" &gt链接文字&am
JS正则里面^和$的问题
一般来说，正则中的^表示开头，$表示结束比如 ^d+$ 匹配的字符串只能是数字，因为他开头结尾都是数字，那么他就只能匹配： 1 、 12、123....等等d+$ 这个就匹配结尾是数字：比如：abc123^d+ 就匹配开头是数字
台式机风扇怎么样清灰
觉得台式机风扇太多灰尘了，想清理下该怎么办呢?下面由我给你做出详细的台式机风扇清灰方法介绍!希望对你有帮助!台式机风扇清灰方法一：一般可以采用两种方法清除电脑电源风扇的灰尘： 1、用手工清除。拆下风扇，取
超级go是什么平台
超级go商城是一个集微信公众号和app于一体的综合性商城服务平台。由爱共享超级GO商城平台特色：一元体验，每日多场一元包邮体验，需一元即可体验优质商品；循环的两级分润机制，分享也能轻松赚大钱；每日推荐超值好货，低价购买超高性价比商品。支
Go语言基础语法（一）
本文介绍一些Go语言的基础语法。先来看一个简单的go语言代码： go语言的注释方法：代码执行结果：下面来进一步介绍go的基础语法。 go语言中格式化输出可以使用 fmt 和 log 这两个标
js是什么意思？
学计算机编程的朋友应该对js这个词是非常熟悉的，很多人会经常用到js，那么下面我来跟大家说说js是什么意思。简要回答Javascript（JS）是一种脚本语言，主要用于 Web，它用于增强 HTML 页面，通常可以嵌入 HTML
《Go语言编程》pdf下载在线阅读全文，求百度网盘云资源
《Go语言编程》百度网盘pdf最新全集下载:链接：https:pan.baidu.coms12soZuRrnDGL1HPKxA8ddoQ?pwd=hcru 提取码：hcru简介：这本书从整体的写作风格来说，会以介绍 Go 语言特性
为什么电脑截屏截不了?
问题一：电脑不能截图了，是什么原因？原因是因为你可能装了其他的软件，快捷键和qq的截图快捷键有冲突，所以你就想想这几天装什么软处了，卸载了试试看好使不要不把你qq截图的快捷键换一下试试看好使不，具体的点你qq头像，然后左下角系统
mac russian red和ruby woo哪个好看_试色对比
mac russian red，从名字也可以看出来这是一个非常正的红色口红，不少妹纸表示很纠结mac russian red和ruby woo，下面就一起了解一下mac russian red和ruby woo两支都有，这两个颜色都
Go语言中怎么通过一个字符串调用对应名称的函数
按值传递函数参数，是拷贝参数的实际值到函数的形式参数的方法调用。在这种情况下，参数在函数内变化对参数不会有影响。默认情况下，Go编程语言使用调用通过值的方法来传递参数。在一般情况下，这意味着，在函数内码不能改变用来调用所述函数的参数。考虑函
R语言三个矩阵求和计算方法
R语言三个矩阵求和计算方法：创建一个用户定义的函数，如果输入x和n，该函数计算从1到n中所有x的倍数之和，sum函数求和，向量求和得到一个数，矩阵求和得到一个向量，把每行求和以后，再进行列求和就是最后的求和。按行求和，即每一行元素的加和，
微星游戏本用Excel为什么卡
办公软件太大。内存太小了呗，EXCEL是一个比较大的办公软件，如果你觉得内存够的话，那可能就是软件本身的问题，重新安装一下就可以解决你所说的问题了。微星的游戏本和ROG、外星人相比只是小字辈，但凭借精准的市场定位和不错的产品品质，现在也已经
14、CSS中颜色设置方法
在我们的显示屏中，一个像素点由三原色构成，分别为：红、绿、蓝。然而在计算机中使用0-255来表示某个原色的不同程度，在二进制中，可以使用八位二进制（00000000-11111111）进行表示。在十六进制中用（ 00-ff ）表示。那么红

推荐阅读

热门文章

最新发布

标签列表

用R语言对vcf文件进行数据挖掘.2 方法简介

给您推荐相同类型的内容：