用R语言对vcf文件进行数据挖掘.2 方法简介

2023-02-23 16:15:02Python023

用R语言对vcf文件进行数据挖掘.2 方法简介,第1张

vcfR 可以直接读取vcf格式的数据。如果同时读取参照序列fasta格式的序列文件和gff格式文件的注释文件还可以获取更完整的信息(此步骤并非必须，可以只读取vcf数据)。在此处便于重复用到了 pinfsc50 包。这个包里是植物致病微生物的基因序列测序结果。包含了一个vcf文件，一个fasta文件和一个gff文件。

这里用到参照序列的数据。

当这些数据被读取到内存的时候就可以开始对染色体名字或者其它一些东西进行修改了。由于 vcfR 更擅长对的单独染色体进行分析，所以当你的基因过大或者有很多样本的时候，建议对数据进行拆分。

读取完数据以后就可以建立 chromR ，来对数据进行详细的分析。

首先对数据进行初步的可视化,

我们在上面的图里得到很多信息，比方说测序深度(DP)的峰在500，但是拖着尾巴，这个尾巴表示数据里包含着CNV信息。然后比对质量(MQ)的峰值在60,于是我们可以以60为中心对数据进行过滤。

使用 masker 可以对数据进行过滤标记。然后可视化过滤以后的数据。

是不是顺眼多了。当然我们也可以看一下SNP的分布情况。注意右下角的图。

用 chromoqc() 可以对数据进行更完整的可视化。包括外显子内含子的分布，GC含量的分布等等。

最后可以用函数 write.vcf() 把数据输出成新的vcf文件。

刚接触R语言一周，和matab不同R作用于数据挖掘的库很多,详解见 R语言数据挖掘包

，下面简介文本分析经常使用到的三个包

tm 为文本挖掘提供综合性处理 Rwordmsg 进行中文分词 wordcloud 统计词云

以第三届泰迪杯A题提供的数据集国美-Sheet1进行文本分析 : 第三届泰迪杯

转化为txt的数据集如下图所示:

生成词云:

数据文件序列染色体数据挖掘

# 上一篇：python语言属于什么语言

# 下一篇：嘿老头宋佳背的黑色包包是什么牌子

给您推荐相同类型的内容：

如何查看linux下java版本？
输入命令：java -version会显示：java version "1.7.0_79"Java(TM) SE Runtime Environment (build 1.7.0_79-b15)Java Hot
如何用电脑设计海报
问题一：如何用电脑制作宣传海报用ps就可以实现。说不定我可以帮你 hi我问题二：怎样用电脑做海报？需要使用的是你的OFFICE完整安装自带的PUBLISHER软件，或者是专业的制版软件。希望能解决你的问题。 1、在动
R相比于matlab有哪些优势？为什么现在被越来越多的使用
这是我在 Why R | learnR 中总结出的几点R的优势，其中一些可以认为是R对Matlab的优势：免费。不需要任何授权费用，对于个人和企业来说在成本方面都有一定的吸引力。开源。源代码的开放保证了你可以知道所有的细节，对于开发者和企业
计算机编程都有哪些语言？？（全）
这个问题.......编程语言太多了，c c++java.netjsp aspvcvbvf c#，除了这些之外，还有js,vb,as,lisp,ruby，perl,plsql,易语言等等。看过钢铁侠吧，里
c语言中else if 是什么意思,怎么用的?
用到else if，说明至少有三种情况。if（情况一）{.....}else if(情况2){...}else{...}规则是else与他上面的最近的还没有配对的if配对。例如判断三角形的。if((a+b&gtc)&am
求C语言闪烁星空语句
在C的文件夹下有个Demo程序，里面就含有你所要的代码。voidPutPixelDemo(void){intseed=1958inti,x,y,h,w,colorstructviewporttypevpMainWindow("Pu
go语言中键值对？
这是初始化的语法规定而已其他语言也是类似的{1: "gd",2: "rew",} 这样相当于一个匿名的字典在python里面，比如d = {'a':1}和d = {}d['
JAVA 获取class对象类名.class Class.forName()两种方法什么情况下使用为什么？
Class.forName()是根据类名称加载类比如有一个类名为com.abc.AAA 此处Class.forName(‘com.abc.AAA ’).newInstance()就会创建一个AAA对象而.class一般用来获取类的通用属性
C语言和JAVA的面对过程思想和面对对象思想分别是什么?
C：标准的面向过程思想的语言，比如：我要造一辆车，那么C语言的面向过程的思路就是1.招工2.买车轮3.买车皮4.买玻璃5.买座椅6.买发动机7.组装底盘8.组装车轮9.组装车身10.组装发动机11.组装玻璃12.组装座椅，这样一步步把造一辆
学习python有什么好的视频教程?
[python视频教程] lets python视频教程免费下载链接:https:pan.baidu.coms1YYn_vepCtq3CcKBD-vfnuw提取码:dxpn[python视频教程] lets python 视频教
python可以用来干什么
1、系统编程：提供API，能方便进行系统维护和管理，Linux下标志性语言之一，是很多系统管理员理想的编程工具，这也是国外为什么使用者这么多的原因，我们国内很少使用Linux。2、图形处理：有PIL、Tkinter等图形库支持，能方便进行图
r怎么把x轴文字变数字
1. 如何excel图表里面横坐标文字改成数字最简单的就是增加一列数据，将原来的年份用 1、2、3 替换，并使用该数据生成图表即可。如果不想改数据，那就只能改标签了，鼠标右键点击横轴 ==》选择数据==》编辑水平标签，然后自己输入类似以下
笔记本电脑怎么连网
笔记本电脑联网的方法如下：工具／原料：联想小新、Windows10、本地设置10。1、首先点击我们笔记本屏幕右下方的网络图标，如下图所示。2、然后点击WLAN图标，如下图所示。3、接着点击一个我们知道密码的WiFi，如下图所示。4、然后
go是什么编程语言？主要应用于哪些方面？
Go语言由Google公司开发，并于2009年开源，相比JavaPythonC等语言，Go尤其擅长并发编程，性能堪比C语言，开发效率肩比Python，被誉为“21世纪的C语言”。Go语言在云计算、大数据、微服务、高并发领域应用应用非常广
java 如何通过对象获取对象类全名？
java是不支持在运行中进行强制转化的！如果事先知道类型，可以通过强制转化实现！如果不知道！可以采用这种方式！String className =obj.getClass().getName()得到类名然后：A a =
为什么要使用 Go 语言？Go 语言的优势在哪里
1、学习曲线它包含了类C语法、GC内置和工程工具。这一点非常重要，因为Go语言容易学习，所以一个普通的大学生花一个星期就能写出来可以上手的、高性能的应用。在国内大家都追求快，这也是为什么国内Go流行的原因之一。2、效率Go拥有接近C的运行效
python软件开发的案例有哪些，可用于哪些开发
列举一些比较有名的网站或应用。这其中有一些是用python进行开发，有一些在部分业务或功能上使用到了python，还有的是支持python作为扩展脚本语言。数据大部分来自Wikepedia和Quora。Reddit - 社交分享网站，最早用
python是最好的编程语言吗?
① 开发效率高，Python具有非常强大的第三方库，在此基础上进行开发，很大程度上提高开发效率② 面向对象，python的编程思想更符合人类的思维逻辑，不需要像C语言那样去理解计算机的运行思维③ 免费、开源，可以自由阅读源代码并进行改动，实
能够在冬季开花的植物有哪些？
中国花箱交易网：近几年来，彩叶植物、芳香植物一直是国内园林植物的引种方向，并取得了很好的市场效果。随着市场应用的多元化，在冬季能够开花的植物成为广大种植者关注的焦点。花期在冬春季的地中海荚在国内引种成功后，即得到业界的充分肯定，并且在江南
R语言是什么？
《R语言4.0.4软件》百度网盘资源免费下载:链接: https:pan.baidu.coms160twe4ScMvIbGm2TI_sjHw?pwd=3ts7 提取码: 3ts7R语言4.0.4是一款专业的统计建模软件，与其它建
c语言求助？
在C的运算符中，关系运算符&gt,&lt,&lt=,&gt=的优先级，高于关系运算符 ==, !=而赋值运算符的优先级就更低。所以，printf("%d,%dn",a&gtb==
华裔美国文学的代表作家都有谁
美国文学史的划分认可了许多文学史学家赋予独立战争（1775—1781）、南北战争（1861—1865）、第一次世界大战（1914—1918）、第二次世界大战（1939—1945）的重要性。在这些粗略的划分下列举了一些被更广泛应用的术语，以区
R语言中向量的外积的符号是怎么输入的
1.“插入公式”功能在“插入”选项卡下的“符号”菜单中。如图点击“公式”按钮。2.如果点击了下拉菜单，则选择“插入新公式”选项。3.可以看到，当点击了“公式”后，进入到了公式编辑的状态。（使用“Alt+=”快捷键可直接进入此界面）4.首先插
看得见风景的房间中的女主角还演了哪些电影
女主角：海伦娜·伯翰·卡特饰演Lucy Honeychurch海伦娜·伯翰·卡特出生于英国伦敦的Golders Green。卡特在电影圈成名得很早，20岁之前就在电影《看得见风景的房间》中出任女主角。2001年，海伦娜接拍了好莱坞的年度
GO语言学习系列八——GO函数(func)的声明与使用
GO是编译性语言，所以函数的顺序是无关紧要的，为了方便阅读，建议入口函数 main 写在最前面，其余函数按照功能需要进行排列 GO的函数不支持嵌套，重载和默认参数GO的函数支持无需声明变量，可变长度，多返回值，匿名，闭包
python一般用什么软件
《Python 3.9.7软件》百度网盘资源免费下载:链接: https:pan.baidu.coms1BY60FGfwL3exK7xOooF_nw?pwd=nhfc 提取码: nhfcPython 3.9.7最新正式版是一种面
Python怎么下载cfg模块
命令行下载。具体下载方法如下。1、在命令行中输入pipinstallrequests（这次以这个模块requests为例，python中的下载工具，新版的pycharm中带有，若没有可以去官网上下载），便可以下载模块。python目录可以分
golang之大端序、小端序
当分别处于大小端模式下的内容存放如下 (1)大端模式存储（存储地址为16位）地址数据 0x0004(高地址) 0x44 0x00030x33 0x00020x22 0x0001(低地址) 0x11
ruby老师什么意思
ruby老师什么意思，Ruby老师是爱尔英语非常有名的二册授课教师之一,国家二级笔译,英语专业八级,曾担任哈尔滨工业大学国际合作交流学院英语金融,商务英语及雅思口语课程的主讲教师。Ruby老师虽是一名女授课教师,但不让须眉的个性让她的课堂充
晚清流行于上海的洋泾浜英语是什么样的，现在还在使用吗？
1845年11月，上海道台宫慕久与英国驻上海首任领事巴富尔签订了一份协议《上海土地章程》，将当时上海县城外一块河汊纵横、无人居住的滩涂荒地，租借给英国人修建房屋居住。这一块地盘，位于洋泾浜北、李家场南，大约有800多亩。3年后，英国人将它

推荐阅读

热门文章

最新发布

标签列表

用R语言对vcf文件进行数据挖掘.2 方法简介

给您推荐相同类型的内容：