r语言孟德尔随机化分析,怎么把ivw改成随机效应模型

Python011

r语言孟德尔随机化分析,怎么把ivw改成随机效应模型,第1张

孟德尔随机化(Mendelian randomization,MR)是以孟德尔独立分配定律为基础进行流行病学研究设计和数据分析,论证病因假说的一种方法。由基因型决定中间表型(暴露)的差异, 因果方向明确。

通过引入一个称之为工具变量的中间变量,来分析暴露因素和结局之间的因果关系

2.孟德尔随机化 vs RCT

孟德尔随机化的目的不是估计遗传效应的大小,而是估计暴露对结果的因果效应,所以与遗传变异相关的结局的平均变化幅度可能与干预措施导致的变化幅度不同

即使遗传变异与结果之间的关联程度很小,暴露的人群归因风险也不一定很低,因为暴露可能会比遗传变异解释更大的变化程度(例如,他汀类药物对低密度脂蛋白胆固醇水平的影响比低密度脂蛋白胆固醇水平与HMGCR基因变异的关联要大几倍,因此对后续结果的影响更大。)

孟德尔随机化要求大样本研究,变异发生率不能太小(最小等位基因频率MAF>5%)

3.工具变量

工具变量本身是一个计量经济学的概念,在孟德尔随机中,遗传变异被用作工具变量评估暴露对结局的因果效应,遗传变异满足工具变量的基本条件总结为(孟德尔随机化核心假设):

关联性假设——遗传变异与暴露有关

独立性假设——该遗传变异与暴露-结果关联的任何混杂因素均不相关

排他性假设——该遗传变异不会影响结果,除非可能通过与暴露的关联来实现

某研究组想了解非洲村落里的儿童补充维生素A和其死亡情况的关联,如果仅仅利用维生素A的服用情况和死亡情况去判断两者的关联,那极有可能会产生很大的偏倚,这是因为维生素A的服用情况和很多潜在因素相关,比如家庭的经济困难程度、家庭成员以及实验儿童的依从性,而这些潜在的因素也可能对儿童的身体健康有很大的影响。因此,在研究起始设计中,研究者便利用工具变量来解决这个问题。

在这里,工具变量Z是指服用维生素A这个任务,类似于随机抽签。这样的话工具变量Z便只和X服用维生素A这个行为相关,与除X以外的混杂因素不相关。

4.应用范围

行为因素与健康:基因变异引起各个倾向某行为,决定暴露状态。如ALDH2变异引起乙醛代谢障碍,改变饮酒行为,不同ALDH基因型代表饮酒量多少;

机体代谢产物与疾病关系,估计长期效应。代谢产物是基因表达的中间表型,酶的底物或者体外难测量的代谢指标:如LDL受体基因变异引起家族高胆固醇血症,比较不同基因型之间CHD发病情况的差异,可模拟血胆固醇水平和CHD发病关系;

子宫内环境暴露于子代健康关系。

5.发文分析

孟德尔随机化研究均发表在影响因子5分以上的期刊中

6.基础分析流程——TwoSampleMR

找工具变量,我们要的是基因作为工具变量,这些基因都是从别人的研究中挑出来的,所有的基因研究有个专门的库叫做genome wide association studies (GWAS)。我们需要做的就是从这个库中挑出来我们自己需要的和我们暴露相关的基因变量SNPs。

估计工具变量对结局的作用,工具变量对结局的作用也是从所有的研究中估计出来的整体效应,这样可以拒绝单个研究的偏倚。

合并多个SNP的效应量,这个效应量是我们得到暴露和结局因果效应的前提。

处理数据,用合并后的数据进行孟德尔随机化分析和相应的敏感性分析。

7.TwoSampleMR代码实现

安装相关R包

install.packages('devtools')

library('devtools')

install_github("MRCIEU/TwoSampleMR") #安装TwoSampleMR包

library('TwoSampleMR')

devtools::install_github("mrcieu/ieugwasr",force = TRUE)

获取MR base的表型ID,将结果保存为pheno_info.csv这个文件

ao <-available_outcomes(access_token=NULL) #获取GWAS数据,但近期Google限制,容易被墙

write.csv(ao,'pheno_info.csv',row.names=F)#将数据写入本地存储

查看pheno_info.csv文件,获取与暴露相关的工具变量的信息以及结局信息。这里选择暴露为obesity class 2 (ID = 91), 结局为 type 2 diabetes (ID = 1090)

exp_dat <- extract_instruments(outcomes=91,access_token=NULL)

obesity_exp_dat <- clump_data(exp_dat)

t2d_out_dat <- extract_outcome_data(snps=obesity_exp_dat$SNP, outcomes=1090, access_token=NULL)#提取结果信息

dat <- harmonise_data(exposure_dat =obesity_exp_dat, outcome_dat= t2d_out_dat)#数据合并,计算基因对结局的合并效应量

孟德尔随机化

results <- mr(dat)

OR值

OR <- generate_odds_ratios(results)

异质性检验

heterogeneity<- mr_heterogeneity(dat)

多效性检验

pleiotropy<- mr_pleiotropy_test(dat)

逐个剔除检验

leaveoneout<- mr_leaveoneout(dat)

散点图

mr_scatter_plot(results,dat)

森林图

results_single<- mr_singlesnp(dat)

mr_forest_plot(results_single)

漏斗图

mr_funnel_plot(results_single)

实例解析

2022年10月10日

西安交通大学生物医学信息与基因组学中心杨铁林教授团队在Nature Neuroscience (IF=28.771)期刊发表了题为:Mendelian randomization analyses support causal relationships between brain imaging-derived phenotypes and risk of psychiatric disorders 的文章。

研究背景

精神类疾病是一组脑功能紊乱的复杂疾病,会导致情感、认知和行为受到干扰和破坏。全球约有数亿人患有不同的精神障碍,被列为严重的公共卫生问题。近年来,脑影像学数据在脑疾病和功能的研究中受到广泛关注。以核磁共振成像为代表的脑影像技术,可用于活体无创定量评估人脑结构、连接和功能的特性。

虽然已有大量的观察性研究证据表明,精神疾病患者与健康正常人的脑影像表型存在显著差异,但脑影像学数据与精神障碍发病机制的因果关系尚不明确,探讨脑影像表型对精神疾病的因果作用具有重要的生物学和临床研究意义。

研究方法和结果

该研究基于大规模基因组数据,对常见的10种精神类疾病(包括注意力缺陷多动症、神经性厌食症、焦虑症、孤独症、双相情感障碍、抑郁症、强迫症、创伤后应激障碍、精神分裂症、抽动症)和587个关键的脑磁共振成像(MRI)结构表型进行了因果关系评估。

正向孟德尔随机化结果发现,脑白质纤维束的上额枕束的FA值和上放射冠的ICVF值、胼胝体内矢状层的MD值、第三脑室的体积等9个脑影像表型是精神分裂症、神经性厌食症和双相情感障碍的风险因素。进一步通过反向孟德尔随机化分析显示,发现精神分裂症的发生会导致额下回眶部的表面积和体积的增加。

该研究将基因组信息作为纽带,使脑影像表型和精神疾病联系起来,避免了观察性研究中由于药物或环境、生活方式等改变引起的样本检测数据偏差的缺点,确保了研究结果的稳健性。

56各民族有各自的语言,光汉语就分以下几种:官话 官话,或称官话方言、北方话等:指华北、东北及西北地区、湖北大部、四川、重庆、云南、贵州、湖南北部、江西沿江地区、安徽、江苏大部所使用的母语方言。官话大致分为华北官话、西北官话、西南官话、江淮官话,华北官话分布在北方东部,以北京话为代表,西北官话分布在北方西部,以西安话为代表,西南官话分布在南方西部,以成都话为代表,江淮官话分布在南方东部,以扬州话为江淮话的代表。上古时期的中原雅音在五胡乱华、衣冠南渡后,分化成为中古汉语语音。而现代“官话方言”,主要形成于宋元时期。官话在形成之后,在南北方分别发展,由分化成了南方官话和北方官话,为以后中国各代的官方语言,北方官话至今是现代标准汉语的基础(中国大陆称为普通话,台湾称为国语)。使用这一方言的人占中国人口的70%。需要指出的是,“官话方言”,过去曾经称为“北方方言”,并不局限于中国北方。相反,中国西南地区和江淮地区的南方方言也属于官话方言。官话的明显特点包括:失落了全部中古入声,中古汉语中的“-p,-t,-k,-m,-n,-ng”韵尾现在只剩下“-n,-ng”,但出现了大量儿化韵“-r”韵尾。原本连接“i,ü”韵母的“g,k,h”声母已被颚音化成“j,q,x”声母。官话话在失去清浊对立的过程中,没有经过剧烈的声调分化,但出现了中古平上去入以外的轻声。因此,官话方言包含了大量的同音字以及相应产生的复合词。上述现象在其他方言中比较少见。吴语 吴语,或称吴方言:在中国江苏南部、安徽南部、上海和浙江大部分地区使用。典型的吴语以苏州话为代表。其中安徽西南部受赣语影响,浙江南部保留了较多古代百越话特征,以至不能和作为典型吴语的太湖片吴语通话。使用人数大约为总人口的8.4%。这种方言的对清浊辅音的区分是一个很明显的特点。但吴语保留了中古汉语的模糊入声。客家话 客家话,或称客语:在中国南方的客家人和绝大多数畲族人中广泛使用,包括广东东部、北部、福建西部、江西南部、广西东南部等地,以梅县话为代表;此外在台湾也有相当的操客家话的族群。 虽然是一种南方方言,但客家话是在北方移民南下影响中形成的。客家话因而保留了一些中古中原话的特点。使用客家话的人口大约占总人口的5%。客家方言的特点是平声,上声不分阴阳,但入声,去声分阴阳。 闽语 闽语,或称闽方言:在福建、海南、广东东部、菲律宾、台湾、新加坡、马来西亚还有其他海外的一些华人中使用。由于闽语的内部分歧比较大,通常分为闽南方言(以厦门话为代表)、闽北话(以建瓯话为代表)、闽东话(以福州话为代表)、莆仙方言和闽中方言。闽语是所有方言中,唯一不完全与中古汉语韵书存在直接对应的方言,其中以闽南语最具影响。但是,根据现有的语音学研究,闽语的音系相当接近上古汉语的音系。闽南语(狭义的,即闽台片闽南话)共有“-m,-n,-ng,-p,-t,-k,-�0�3”(貌似问号的国际音标是紧喉音。)在入声 [-p/-t/-k] 消失之前,先发生‘入声弱化’,[-p/-t/-k] 全部变成 �0�3。山西方言仍保有这种弱化入声)”七种辅音韵尾。闽南语是汉语中声调较复杂的方言之一,泉州音有8个声调(不含轻声),漳州音、厦门音、同安音、台湾音通常有七个声调(不含轻声调、高声调)。同时,闽南语也是保留中古汉语最完整的方言之一。泉州音和漳州音是其它支系的母语,闽(南)台片的闽南语内部较为一致。广义的闽南方言还包括海南话、潮州话、浙南闽语等,使用闽南语的人口大约为总数的4.2%。 粤语 粤语:以广州话为标准,在广东、香港、澳门、广西的东部和海外华人中使用,中国的一些少数民族如京族、部份壮族也使用粤语。粤语是汉语众多分支中声调最复杂的一种。标准粤语有九个声调,某些方言如勾漏方言、桂南平话方言具有十个声调。粤语完整保留了中古汉语的 -p、-t、-k、-m、-n、-ng 六种辅音韵尾。粤语没有混合入声,可以认为粤语中保留的古汉语成分要早于吴语,但晚于闽语,大约对应隋唐时期的中古汉语。绝大部份汉字都有对应的粤语发音。粤语的口语和社会上普遍使用的现代汉语白话文在词汇、语法上差别非常大,存在严重的文、言脱离现象。粤语有一套自己的书面的白话文表示方式,参见粤语白话文。粤语内部具有多种方言,详细请参看粤语方言。使用粤语的汉族人口大约为汉族人口总数的5%。海外华人特别是美洲、澳大利亚华人90%以上都是粤语区移民,普遍使用粤语。湘语 湘语,或称湘方言:在湖南使用。按是否保留浊声母分类,可分为老湘和新湘两类,其中浊声母已全部清化的新湘语相对接近西南官话。分别以长沙话(新)及双峰话(老)为代表,使用者约占总人口的5%。历史上湖南湖北两省受到北方文化的强烈影响,故湘语内部差异比较大。并且有多个时期古汉语语音特征之重叠。赣语 赣语,或称赣方言:以南昌话为代表,主要用于江西大部、湖南东南部。使用人数约为2.4%。赣方言在音系上与客家方言十分接近,因此学术界有将赣客方言统一归类的提议。其他方言 下面的几种方言是否构成独立的大方言区,现在尚有争议:晋语:在山西绝大部分以及陕西北部、河北西部、河南西北部、内蒙古河套地区等地使用,以太原话为代表,有入声韵—— [-�0�3](这貌似问号的国际音标是紧喉音。在入声 [-p/-t/-k] 消失之前,先发生‘入声弱化’,[-p/-t/-k] 全部变成 [-�0�3])。其白读系统与官话截然不同。以前(及现在的不少语言学学者)将其归于官话。 平话:在广西的部分地区使用。传统上将桂南平话归于粤语,近年来有人主张将桂北平话当成孤立的土语存在。 徽语:在安徽南部及赣浙苏部分毗邻地区使用。以前(及现在的部分语言学学者)将其归于吴语。

交大有很多好教授,每位教授的风格都不太一样,所以可能就是萝卜白菜各有所爱,我来说说我比较推荐的吧。

交大男神喻丰老师的心理课是一定会挤着头皮去上的,当然,挤着头皮也不一定能上得了。喻老师每学期都会开设社会心理学这门课程。每年这个时候原本只有200人的课程,初选的时候总有上千人选择。当然,选不到老师的社会心理学,还有别的途径可以听他讲课,他时常会被邀请作讲座,比如在钱学森图书馆的星空报告厅。喻老师会用他高深的学问和深深的人格魅力吸引你,听过的人就会喜欢上他。

人文学院韩鹏杰老师的道家的智慧已经是一门在网上的Mooc了,听完老师的课,真的会有很多的触动,并且韩教授还是指导交大辩论队打遍天下无敌手的人,也会在很多比赛看到韩老师做评委。

在交大,没有上过张正明教授的军事理论的人,你的大学是不完整的,当然这个不急,军事理论是每一位交大学生必备的课程。

高数是大学比较基础又很重要的学科,并且在考研中占很大的比例。如果高数有问题,数学学院郭丁和老师的高数课不应该错过,郭老师每节课都会手写板书。一节课一节课,一黑板一黑板地写。而且郭老师也很可爱,学生们私下都叫他欧巴哦!

交大还有很多教授的课很棒啊,答主只能写一写自己上过的,其实找自己感兴趣的课去蹭,是最幸福的呢。