用R语言对vcf文件进行数据挖掘.7 测序深度覆盖度

2023-02-22 02:12:01Python08

用R语言对vcf文件进行数据挖掘.7 测序深度覆盖度,第1张

vcf数据里除了位点的ATGC的对比，进行纯合/杂合判断的以外。还有一个重要的项目就是 DP ，测序深度。测序深度不仅是看测序质量的重要参考，也是对染色体倍数体以及基因拷贝数进行评估的重要指标。

一般的VCF文件都很大，用手动提取里面的信息肯定不大现实。用 vcfR 就可以轻松实现。

查看一下R读取的数据。

选取我们需要的部分也就是Genotype Section里的 DP 区域。

众所周知箱状图的特点就是(boxplot)包含了所有的信息，包括异常值outlier。正因为这个原因，这张图很大程度上受到了这些异常值的影响，变得非常难懂。自己看看还可以，用来发表文章的话肯定不行。

经过log2转换，我们可以得到理想的效果。

又或者不需要转换，而是通过过滤数据来改善箱图效果。举个例子，提取90%的信赖区间的数据来可视化。

这样也可以获得类似的结果。

一般的VCF文件都很大，用手动提取里面的信息肯定不大现实。用 vcfR 就可以轻松实现。

vcfR 自带测试文件 vcfR_test 。就用这个文件来操作一下吧。

在分区 Genotype 里，通过观察 FORMAT 列可以看到一共有四种类型的数据 GT:GQ:DP:HQ ，至于这四种类型的数据个各自代表什么意思大家可以查阅知乎百度谷歌。我们可以提取出我们想要的数据类型。比方说最重要的 GT (genotype)。

同样，我们也可以提取例如 DP (测序深度Read Depth)的数字矩阵。

值的注意的是这里用到了参数 as.numeric = TRUE 使得数据自动转换成了数字。但是并不是对所有类型的数据都有效，比方说我们重复一下提取 gt 。

在没有任何报错的情况下 gt 变成了一堆毫无意义的数字，很明显不合理，不要用这些经过错误转换的数据进行下一步分析，比方说喜闻乐见的主成分分析。

在一些类型的数据里可能会出现一个以上的结果，比方说上面的 HQ 数据。

一般情况下我们只需要每一列的第一个数字

不需要samtools之类的软件我们也可以实现vcf数据读取自由，关键是可以直接写入内存进行下一步的统计分析和数据可视化，个人感觉是很有效的提高了生产力。值得花时间学习一下这个工具。

数据文件比方说深度数字

# 上一篇：在java中怎么比较三个整数大小例如（a , b, c）；并从小到大输出

# 下一篇：普通话考试说话是自己挑一个题目还是抽签定题目？?

给您推荐相同类型的内容：

js子页面向父页面传值问题
父窗口添加&ltinput type="hidden" id="s"&gt子窗口window.parent.docuent.getElementById("s")
电脑桌面图标怎么变大
1、打开电脑桌面，在空白处点击右键,选择属性。2、进入外观设置面板，打开高级选项。3、进入到高级外观窗口。4、在项目的下拉列表中选择图标。5、项目设置的后面有一个大小设置，任意设置想要的大小。6、图标变小了。第一种方法：
R语言常用函数（基本）
vector：向量 numeric：数值型向量 logical：逻辑型向量 character；字符型向量 list：列表data.frame：数据框 c：连接为向量或列表 sequence：等差序列 rep：重复 length
R语言常用函数（基本）
vector：向量 numeric：数值型向量 logical：逻辑型向量 character；字符型向量 list：列表data.frame：数据框 c：连接为向量或列表 sequence：等差序列 rep：重复 length
数据驱动以及vue功能原生js实现
把界面要变化的部分，抽取到动态数据中，通过数据变化，自动更新视图 react: 新建.js文件，书写class，render vue：新建.vue文件，书写template react: state = { a
C语言程序输出数字正三角
#include&ltstdio.h&gtvoid PrintNumbers(int line){int i,jif(line&lt1){printf("输入参数错误n")return}
c语言 int最大值是多少？？
c语言中，int最大值是2147483647。c语言中，int、long int 、unsigend long int都是4个字节，其可以用sizeof()()函数得出。占用4个字节的整数其最大能表示数的个数是2^32（4个字节共32位）
如何在HTML中加入JavaScript脚本?
①：可以直接在当前html文件里面写，如x0dx0ax0dx0awindow.onload = function(){}x0dx0ax0dx0ax0dx0ax0dx0a②：可以新建一个后缀名为.js的脚本文件，然后在
TWI-JR工作关系培训心得：授之以鱼，不如授之以渔
8月17天气预报通知市民有台风登陆广东，当时刚好是周末，本来想好利用周末时间又加上又有台风，让自己偷个懒好好的睡上一觉，但是学习的欲望打消了这个念头，早上6：30准时出发前往虎门总站坐车直奔广州，几经周拆于10：00终于到达天河区马赛国际
玩征途2 这款游戏组装台啥配置的电脑呢？个人承受能力 1500-2500
CPU：AMD X4 860k 盒装￥355主板：技嘉 F2A88XM-DS2 ￥369内存：威刚 8G DDR3 1600 ￥319显卡：蓝宝石RX460 2G白金版OC ￥869硬盘：西数1t蓝盘￥287或者固态：三星SSD 120
有哪些比较好的电脑搜题软件？
好用的电脑搜题软件有网课搜题酱、学小易等。网课搜题酱是一款网课搜题工具，采取对话的形式，输入题目，即可大快速的得到网课答案。这里不仅有学习通答案、云青书学堂、知到、智慧树、中国大学慕课等平台的答案都有。据开发者说有1千万题库。学小易是一款
采用CSS和JS的下拉菜单的制作
&ltscript language="javascript"&gt JavaScript DocumentstartList = function() {if (document.all&a
c语言考研真题，题很经典，麻烦高手看看
do{int ikd=1for(i=0a[i]!=0i++)if(a[i]&gt='0'&amp&ampa[i]&lt='9') {kd=0break}}while
电脑暂停键是哪个
以笔记本电脑为例，其暂停键是PAUSEBREAK键，即可以暂停当前程序或者指令的运行，如果是要暂停播放视频可以点击键盘上的空格键来实现。计算机(computer)俗称电脑，是现代一种用于高速计算的电子计算机器，可以进行
用html和css实现仿淘宝首页好嘛？
可以仿它的页面，即使模仿出来，也只是熟悉HTML和css的使用。做出来的也只是一个静态页面，不具备交互功能，更没有淘宝的数据。不过可以通过仿页面提升自己HTML，css的熟练度，和学习网页布局。1、首先是计算一行的价格。这个功能在上篇博客里
如何把两个LI并排成水平，要在CSS里控制
首先得明白行内元素和块级元素。li 是块级元素，要想使两个LI并排成水平排列，得把块级元素转化为行内元素。帮你写的如下：&ltstyle type="textcss"ul li { float:leftlist
拼音r怎么发音？
拼音r是我们常说的翘舌音，有的也说成卷舌音，无论是翘还是卷，其实都是舌头形态的描述，它的具体发音动作是这样的：r：发音时，舌尖上翘，靠近硬腭前部，留出窄缝，嗓子用力发音，气流从窄缝中挤出，摩擦成音，声带颤动。除了r，翘舌音还有zh、ch、
腾讯微博开放平台的java SDK怎么用
1、在你的Java工程中添加该SDK中dist目录下的jar库,并添加到你的编译路径中2、在你的代码中import相应的包名3、非web应用请修改和查阅MainDemo.java，web应用请修改config.jsp，查阅index.jsp
c语言结构体是什么？
c语言结构体是在C语言中一种重要的数据类型。该数据类型由一组称为成员（或称为域，或称为元素）的不同数据组成，其中每个成员可以具有不同的类型。结构体通常用来表示类型不同但是又相关的若干数据。结构体类型不是由系统定义好的，而是需要程序设计者自己
acer care center是什么
Acer Care Center是宏基笔记本电脑中预安装的一项综合管理软件，该软件主要分为六大功能：我的系统、系统检查、系统更新、备份和还原、支持、调整等功能。如何打开Acer Care Center?首先我们通过"Win+Q&q
css 的注释怎么写
CSS中的注释就是：*...** 段落样式 *p{text-align: center* 居中显示*color: blackfont-family: arial} 这段代码放入STYLE或样式表中是可以的。不是每行代号都需要注
电脑如何基本操作
电脑基本操作有：1、电脑开、关机的方法以及开机顺序；2、鼠标、键盘的使用方法；3、简单的上网操作和进行信息搜寻；4、文本文档、演示文稿、图表的基本制作及应用；5、较为快速的打字输入方法；6、将网络平台上的信息下载到个人电脑。电脑的配置，是衡
python对电商设计有帮助吗
是有帮助的。Python由荷兰数学和计算机科学研究学会的Guido van Rossum于1990 年代初设计，作为一门叫做ABC语言的替代品。Python提供了高效的高级数据结构，还能简单有效地面向对象编程。Python语法和动态类型，以
2017IFE-鼠标悬浮模糊效果
2017-百度前端技术学院编码任务：鼠标悬浮模糊效果 DEMO 项目源码这个任务主要是学习和使用 CSS3 大部分的属性，主要使用的属性如下：其实刚开始，我就在结构上面犯了错误。如果把图片作为背景图片使用，
在网页中CSS有什么作用
CSS网页布局的意义体现在如下方面：一、使页面载入得更快由于将大部分页面代码写在了CSS当中，使得页面体积容量变得更小。相对于表格嵌套的方式，DIV+CSS将页面独立成更多的区域，在打开页面的时候，逐层加载。而不像表格嵌套那样将整个页
js中引用php变量，然后php中再次引用js的变量，怎么操作
将php变量输出到html中的js变量即可，html中引用js文件，然后js文件就能获取的这个变量了如html页面&ltscript&gtvar pagetitle='&lt?php echo $paget
普通话考试说话是自己挑一个题目还是抽签定题目？?
普通话考试说话是抽签定题目。普通话水平测试试卷由四个测试项构成，总分为100分。1、读单音节字词100个，限时3分30秒，占10分。目的考查应试人普通话声母、韵母和声调的发音。2、读双音节词语50个，限时2分30秒，占20分。目的是除
C语言结构体数组成员怎么赋值？
intmain(void){structstudentsbao={}printf("%d,%sn",bao.id,bao.name)输出是4224528，空(应该是null)structstudentsb
新买的华硕飞行堡垒7游戏本怎么下载软件？
一般下载软件有两种方式，一种是在浏览器下载的软件。一种是在应用商店下载的软件。方法一：1、打开游览器，直接在百度搜索要下载的软件；2、点击立即下载，选择下载结束后立即打开；3、下载完成后，点击安装包，进行安装，安装结束后打开软件即可使用。方
python if用法
Python条件语句是通过一条或多条语句的执行结果（True或者False）来决定执行的代码块。Python程序语言指定任何非0和非空（null）值为true，0 或者 null为false。Python 编程中 if 语句用于控制程序

推荐阅读

热门文章

最新发布

标签列表

用R语言对vcf文件进行数据挖掘.7 测序深度覆盖度

给您推荐相同类型的内容：