用R语言对vcf文件进行数据挖掘.2 方法简介

2023-02-26 17:05:01Python07

用R语言对vcf文件进行数据挖掘.2 方法简介,第1张

vcfR 可以直接读取vcf格式的数据。如果同时读取参照序列fasta格式的序列文件和gff格式文件的注释文件还可以获取更完整的信息(此步骤并非必须，可以只读取vcf数据)。在此处便于重复用到了 pinfsc50 包。这个包里是植物致病微生物的基因序列测序结果。包含了一个vcf文件，一个fasta文件和一个gff文件。

这里用到参照序列的数据。

当这些数据被读取到内存的时候就可以开始对染色体名字或者其它一些东西进行修改了。由于 vcfR 更擅长对的单独染色体进行分析，所以当你的基因过大或者有很多样本的时候，建议对数据进行拆分。

读取完数据以后就可以建立 chromR ，来对数据进行详细的分析。

首先对数据进行初步的可视化,

我们在上面的图里得到很多信息，比方说测序深度(DP)的峰在500，但是拖着尾巴，这个尾巴表示数据里包含着CNV信息。然后比对质量(MQ)的峰值在60,于是我们可以以60为中心对数据进行过滤。

使用 masker 可以对数据进行过滤标记。然后可视化过滤以后的数据。

是不是顺眼多了。当然我们也可以看一下SNP的分布情况。注意右下角的图。

用 chromoqc() 可以对数据进行更完整的可视化。包括外显子内含子的分布，GC含量的分布等等。

最后可以用函数 write.vcf() 把数据输出成新的vcf文件。

在 scater R包里，有个函数 plotHighestExprs ，可自动根据SingleCellExperiment对象数据进行绘制。但有个缺点就是太慢了，具体操作如下

具体可分为三种情况

最主要的原始是，不同细胞的文库大小可能因测序过程存在差异。通过标准化，可使基因在不同细胞的表达情况具有可比性。

上述两步也可合并成一步，但可能跳的有点多，关键理解如下示例的第三步的除法：

（1）R语言的计算是向量化的；例如可以进行向量间加减乘除运算，具体规则，自己尝试下理解更深刻；

（2）应用到矩阵时，可以理解为一行代表向量的一个元素。

如下图，结果与我们上面计算的有点不同；

查看 NormalizeData 帮助文档可知，其默认方法是计算每个细胞中基因表达量与文库的比值，然后乘一个size.factor(一般是10000)，最后进行log转换（加1，避免0以及零点几的无意义结果 log1p ）

参考文章

https://nbisweden.github.io/workshop-scRNAseq/labs/compiled/seurat/seurat_01_qc.html

1、Office Professional Plus 2010：

6QFDX-PYH2G-PPYFD-C7RJM-BBKQ8

BDD3G-XM7FB-BD2HM-YK63V-VQFDK

2、Office Professional Plus 2010：（VL）

MKCGC-FBXRX-BMJX6-F3Q8C-2QC6P

VYBBJ-TRJPB-QFQRF-QFT4D-H3GVB

3、SharePoint Server 2010：（Enterprise）

6VCWT-QBQVD-HG7KD-8BW8C-PBX7T

4、SharePoint Server 2010：（Standard）

HQ937-PP69X-8K3KR-VYY2F-RPHB3

不过我个人感觉2007更好用、更漂亮，2010有太多华而不实的功能，而且太慢了。

数据文件序列基因有个

# 上一篇：Java怎样输入？

# 下一篇：C语言程序设计指针？

给您推荐相同类型的内容：

如何运行一个ruby类中的方法
在Ruby中，有多种方法可以实现方法的动态调用。1.使用send方法第一种实现动态方法调用是使用send方法，send方法在Object类中定义，方法的第一个参数是一个符号用来表示所要调用的方法，后面则是所调用方法需要的参数。“Thisis
java中用==判断两对象是否相等的准则
如果是引用类型的对象作比较，则比较对象地址。如果是基本类型，会分几种情况：1）字符串和数字比较值是否相等例如：'1' == 1 true2）含布尔值或条件表达式，会将布尔值为true转化为1，false为0
Java的值问题
System.out.print(b+" ")会调用Object类的toString方法返回一个字符串。该字符串由类名（对象b是该类的一个实例）、at 标记符“@”和此对象哈希码的无符号十六进制表示组成。换句话说，会返回
在python中如何导入两个不同目录下自定义的模块呢
import sysprint sys.path上面的代码会给出所有可用的python路径，你把.py文件放到这些路径下面就可以在其他文件里导入它了。另外一个特殊的路径就是当前路径，比如你在一个文件夹test下新建两个.py文件，分别为12
最近想入mac ruby woo，买过的朋友发表一下自己的意见，觉得值得入吗？
作为一个拥有100多只口红的美妆小达人希望我的回答能帮到你 MAC ruby woo这只口红，官方宣称的是复古正红，在我的嘴巴上有点偏蓝调红，这个口红非常的干，如果唇部干燥的话，涂可能会脱皮干裂，涂之前建议先做一下唇部护理。
java程序设计题,设计一个宠物商店,内有猫和狗两种宠物,研究名字、颜色和年龄等属
望采纳，打这么多字不容易一、问题描述设计一个宠物商店，在商店中可以有多种宠物，试表示出此种关系，并要求可以根据关键字查找相应的宠物信息。所需要的宠物信息自行设定。1、可以保存多个宠物的信息2、宠物的属性：名字、年龄等3、可以实现宠物上架
java中如何调用其他java文件?
JAVA中方法的调用主要有以下几种：1.非静态方法非静态方法就是没有 static 修饰的方法，对于非静态方法的调用，是通过对象来调用的；2.调用静态方法静态方法就是用 static 修饰的方法，静态方法的调用是通过类名来调用的；3.
GO语言学习系列八——GO函数(func)的声明与使用
GO是编译性语言，所以函数的顺序是无关紧要的，为了方便阅读，建议入口函数 main 写在最前面，其余函数按照功能需要进行排列 GO的函数不支持嵌套，重载和默认参数GO的函数支持无需声明变量，可变长度，多返回值，匿名，闭包
R语言中tseries包为什么安装不上
你好，刚才我在rstudio里尝试了一下，证明很轻松的可以安装上，推测你安装不上的原因是网络情况不太好如果确定网络很好的话，还是安装不上，可以换下镜像地址；换成中国清华大学或合肥科技大的，应该会有所改善。直接谷歌一下，“时间序列分析R语言”
python读取中文目录出现乱码
先对路径进行unicode处理，然后再打开。举例： inpath = 'E:MyProjectSVN_ProjectDrawingboard_localmodelmydatainputproduction示波器
c语言实现顺序表？
--顺序表.h#include&ltstdio.h&gt#include&ltstdlib.h&gt#include&ltmalloc.h&gt#define LIST_INIT_SIZE 1
做动漫纸模最好的纸是什么？
120g的白卡纸最好，价格也不贵，10几20几就能买100张，质量也是很不错的，现在大家做那种小型的动漫人物模型什么的都是用的这种卡，也没什么纸质什么的之说只要别买那种看起来就比其他价钱低很多的就行3D纸模目前还没有店铺在正式销售了，因为国
学生选课系统C语言程序
根据自己的需要，自己看着修改一下 ^^#include&ltstdio.h&gt#include&ltstdlib.h&gtint N1,N2,kk1,kk2,kk3struct couse * head1s
【R语言】常规除法，取整，取余，向上取整，向下取整，四舍五入
常规除法：取整： %% ，就是取结果的整数部分取余： %% ，对于不能整除的情况，取余下来的部分对于取整和取余我们来举个简单的例子，来加深理解向下取整floor() ，floor是地板的意思，就是取小于
C语言怎样将文本文件中的内容读取打印
可以参考下面的代码：#include&ltstdio.h&gt#define F_PATH "d:\myfile\file.dat"char cint main(){FILE*fp=NULL
有没有人知道ROS?
楼主你好！ROS是需氧细胞在代谢过程中产生一系列活性氧簇( reactive oxygen species, ROS)，包括：O2 -·、H2O2 及HO2·、·OH 等。ROS也可称为是Route Operation System.意为“
如何利用Python对中文进行分词处理
python做中文分词处理主要有以下几种：结巴分词、NLTK、THULAC1、fxsjyjieba结巴的标语是：做最好的 Python 中文分词组件，或许从现在来看它没做到最好，但是已经做到了使用的人最多。结巴分词网上的学习资料和使用案例
java中如何调用其他java文件?
你所说的java文件是什么文件？如果是java源码文件是不能调用的，但如果是编译后的class文件可以通过类加载器进行加载，然后通过反射调用；但一般会通过实现特定的接口来简化调用过程。一个自定义的类加载器如下：class MyClassLo
python可以用什么编辑器？
VS Code：这是一个免费、开源、跨平台的代码编辑器，由微软自主设计研发，界面风格和VS相似，但没有VS那么庞大臃肿，运行速度快、占用内存少，支持常见的自动补全、代码高亮、语法提示、GIT等功能，安装Python插件后，可以直接编辑运行P
非计算机专业的大学生学Java好就业还是学go比较好就业？
非计算机专业的大学生学Java现在还是选择java更好就业。因为Java仍然是主流的企业级应用编程语言，但是Go语言代表了未来，很多新兴上市公司用Go做主编程语言，但目前数据上没法和java比。千锋教育有线上免费Java线上公开课。目前
单片机子程序不调用执行吗
不行单片机C语言之流水灯(带延时子程序).ppt》由会员分享，可在线阅读，更多相关《单片机C语言之流水灯(带延时子程序).ppt(12页珍藏版)》请在人人文库网上搜索。1、单片机C语言应用100例,授课教师：莫建平,单片机控制一个灯闪烁单
谁在极客时间学习过GO进阶训练营，学习成果好不好？
我之前在‎极客‎时间学‎习过GO语言，收获‎还‎是挺‎大的，学过编‎程的都知道，G‎O语言已经成为云计算时代基础设‎施编‎程语‎言了，极‎客时间GO语言的毛剑‎老师讲课是真‎的好，他本身就是个资‎深的GO工程师，讲课细致又专业，每一节课都能
如何用r语言爬取json的数据
如果以后抓取网页碰到动态加载的数据，可以考虑使用 phantomjs 如果想更暴力直接开出一个有界面的浏览器做各式各样的操作，达到ajax无阻碍的，可以用Selenium + Beautifulsoupin 1:nrow(metadata)
为什么要使用 Go 语言?Go 语言的优势在哪里?
1、简单易学。Go语言的作者本身就很懂C语言，所以同样Go语言也会有C语言的基因，所以对于程序员来说，Go语言天生就会让人很熟悉，容易上手。2、并发性好。Go语言天生支持并发，可以充分利用多核，轻松地使用并发。这是Go语言最大的特点
python怎么创建新文件
首先，进行打开的pycharm软件界面当中，进行选中已经打开的项目文件。请点击输入图片描述然后进行点击菜单中的“file”的选项菜单。请点击输入图片描述进行点击了file的菜单之后，进行点击下拉菜单中的“new”的选项。请点击输入图片描述这
java中的？判断
1.三目运算格式：(关系表达式结果是布尔值) ？表达式1 ：表达式21如果前面的关系成立，则返回表达式1的值。否则，返回表达式2的值。int a = 20int b = 40返回两者中较大的数：int max = (a&
Java语言的变量由哪些组成
publicprivateprotected类型（四类八种）。变量的定义必须严格按照标识符的命名规则，即0~9数字、字母、下滑线、$等组成，且首字母不能是数字、不能是java关键字。首字母必须小写，当有多个单词组成时，后面的单词首字
java中如何调用其他java文件?
你所说的java文件是什么文件？如果是java源码文件是不能调用的，但如果是编译后的class文件可以通过类加载器进行加载，然后通过反射调用；但一般会通过实现特定的接口来简化调用过程。一个自定义的类加载器如下：class MyClassLo
总结：那些热门的开源游戏服务器框架，还不看你就out了
作为一名业内资深的游戏开发人员，经常会遇到实习的新同事在工作中会问到这样的问题：工作中到底有哪些开源游戏服务器框架，该去值得学习呢？囊括到node.js 、java、C#、golang 、c++、python 等技术栈有各
C语言程序设计指针？
变量前面加&amp代表取出这个变量的地址，&amp又叫取址符指针前面加*代表取出，指针所指向的内存里的数据(值)，*又叫取值符p是指针，n是变量计算机解析代码是从右到左，所以*&ampn = *(&ampn)

推荐阅读

热门文章

最新发布

标签列表

用R语言对vcf文件进行数据挖掘.2 方法简介

给您推荐相同类型的内容：