《数量生态学:R语言的应用》第二版第三章-关联测度与矩阵------Q模式

Python018

《数量生态学:R语言的应用》第二版第三章-关联测度与矩阵------Q模式,第1张

生态学涉及多元统计方法,特别是排序和聚类,都是明确或不明确地基于所有可能对象或者变量之间的比较。这些比较通常采用关联测度(association

meansures)(常称为系数或者指数)的形式,不管是样方还是变量之间的比较都是基于他们组成的矩阵,因此选择合适的关联测度非常重要。

在任何分析之前,需要问下面这些问题:

在两个对象中同一值为零,在这两个对象中可能蕴含的意义不同,但零值增加了对象的相似性。就物种数据而言,两个样方中都没有一个物种可能有不同的解释:不适合生存或者还没有迁徙到此地?因此物种存在的信息比物种缺失的信息更有意义。依据双零问题也可以区分两类关联测度:视双零为相似的依据(同其他值)的为对称系数,反之为非对称系数。在大部分情况下,应该优先选择非对称系数,除非可以确定引起双缺失的原因相同,例如在已知物种组成群落或生态同质区域内的控制实验。

这里可能比较难理解,简单来说就是两个样方都出现0值,但是造成0值的原因可能不一样,所以需要优先考虑非对称系数(除非可以确定引起0值的原因相同)

变量可以是定性变量(名义的或分类的,二元的或多级的),也可以是半定量变量(序数的)或定量变量(离散的或连续的)。所以类型的变量均存在关联系数,其中大部分可以归为两类:二元变量的关联系数(二元系数,指被分析的变量是0-1的二元数据,并非关联测度数值为0-1的数据)和定量变量的关联系数(以下简称为数量系数)

在Q模式分析中,我们需要用到6个程序包:stats(安装基础程序时已经载入)、vegan、ade4、adespatial、cluster和FD等等。

在R中,所有的相似测度方阵可以转化为相异测度方阵,距离方阵(R里面属于"dist"类对象)对角线的值(每个对象与自身的距离)均为0

定量的物种数据通常需要使用非对称的距离测度。在物种数据分析方面,常用的系数有Bray-Curtis相异系数、弦(chord)距离、Hellinger距离和卡方距离。

在R中实现:

当可用的仅仅是二元(有-无)物种数据,或多度的数据不适用,或包含不确定的定量数据时,可使用有-无(0-1)数据进行分析。

关联矩阵一般作为中间实体,很少用于直接研究。然而,如果对象不多,直接展示关联矩阵也很有用,能够将数据的主要特征可视化。

建议使用coldiss()函数可视化相异矩阵。coldiss()函数会使用一个能重新排列矩阵的函数order.single()(属于gclus包),该函数可以根据对象之间的距离沿着对角线重新将对象排位。但是必须先安装gclus包。

在未转化的相异矩阵中,数量多的物种之间的多度差异与数量少的物种之间的多度差异有同等权重。

这些案例均是处理物种数据,Doubs样带具有强烈的生态梯度特征(例如氧含量和硝酸盐浓度)。Doubs样带的环境背景很清楚,可以假设在特定的某一段河流,物种的缺失可能是某种相同的原因造成的,因此可以计算对称系数的关联矩阵。

对双零有明确解释的定量数据,欧氏距离是对称距离测度的最佳选择。注意欧氏距离的值没有上限,但受变量纲量影响较大,所以前面我们的数据转化就派上用场了。

此处用标准化后的环境因子变量(env)计算样方的欧氏距离。先剔除dfs变量(离源头距离),因为它属于空间变量而非环境因子变量。同样使用coldiss()函数可视化距离矩阵。

注意:可以利用scale()函数对环境变量进行快速标准化

相异矩阵的热图很合适快速比较,例如,可以同时绘制基于物种多度和基于环境因子的Hellinger距离图,为了便于比较,两个图均选择等数量的分级

欧氏距离理所应当然可以用于计算基于地理坐标变量的地理距离矩阵。

地理坐标可以是一维或者二维的直角坐标系(笛卡儿坐标),其单位也可以多种多样(例如cm、m、km属于相同投影带的UTM坐标)。如果是球体系统坐标(经纬度),在计算欧氏距离之前必须先转化。SoDA程序包内geoXY()函数可以完成球坐标系统的专业。需要注意的是,标准化数据会改变两个维度的比率,因此一般地理坐标(x-y)不应该标准化(如果需要可以标准化)

对于二元数据,最简单的对称相似测度是"简单匹配系数S1",对于每组样方,S1是 双1的数量加上双0的数量除以变量数

Gower相似系数当作一种对称指数;当数据框内一个变量被当做一个因子时,最简单的匹配规则被应用,即如果一个因子在两个对象中有相同的水平,表示该对象对相似指数为1,反之为0。Gower相异指数可以利用cluster程序包内daisy()函数计算。应避免使用vegdist()函数计算Gower相异系数,因此该函数只适用与定量数据和有-无数据计算,对多级变量并不适用。

只要每个变量给予合适的定义,daisy()函数就可以处理混合变量的数据。当数据中存在缺失值时,该函数会自动排除与含有缺失值样方对的计算。

FD程序包里gowdis()函数是计算Gower相似系数最完善的函数,可以计算混合变量(包括非对称的二元变量)的距离,也可以像daisy()函数一样设置变量的权重和处理缺失值。

对于我们的物种数据,通常具有相同的刚量,通常是正值和零,对这样的数据几种简单的转化函数,可以降低极大值的影响:

简单转化只是对数值进行独立的处理,而标准化是数值之间的处理。

这些标准化过程是否正常运行?最好利用绘图函数或总结函数密切追踪。

注意:Hellinger转化等同于数据先开方后再进行弦转化。

多度数据首先除以该物种最大值后再除以该样方总和

若要展示物种多度数据转化或标准化前后的变化,也可以绘制物种沿河流的多度分布图

在某些情况下(通常是植被研究),使用多度的等级来代表特别的属性:个体数量(多度等级)、盖度(优势程度)或者两者兼而有之(例如Braun-Blanquet 多度优势等级)。这些等级数据即是顺序数据,同时也是随意的数据,这样的数据不容易进行简单的转化。在这种情况下, 必须根据手头的原始数据来将等级数据还原为多度数据

对于离散等级数据可以通过 labdsv包的函数vegtrans() 来进行数据转换。

例如,假如我们要将鱼类多度等级数据(在我们的spe数据从0到5的等级数据)转为平均个体数,我们可以通过提供两个向量来实现,一个是当前等级数,一个是转换等级。

注意:这个转化对于具有物种特异性多度鱼类数据集来说没有意义。

这最后一部分不是很重要,最重要的就是前面的标准化和中心化的处理方法。《数量生态学:R语言的应用》的第二章到这里就全部结束了。

请期待下一期内容。

这个问题是非常专业的。生态理论的一个“繁殖种群”说,生物不同的适应方式在其中生存的条件。 RK选择麦克阿瑟(1962)的生活史策略。

1。 r-选择 - 有利于增加选项,称为内禀增长率r-选择。 R-选择物种所谓的R-战略(对策)(R-strategistis)的。 R-战略的先驱,在新的栖息地,但生存依靠的机会,所以从某种意义上来说,他们是“机会主义者”,它是容易出现“突然爆发的暴力破产

2,K-选择 - 有利于提高竞争力的选择被称为K-选择K-选择物种称为K-战略家(K-strategistis)。K-战略的维护者,稳定的环境,在一定意义上,他们是保守派,在发生灾害时的生活环境,这是难以快速恢复,如果竞争对手的抑制,均可能灭绝。

3。r-选择和k-选择不同的相关特性

在动物实验中,比较大的分类动物,昆虫可视为r-选择,的无脊椎动物K-选择的分类单元内,身体形态,生育能力低,具有良好的保护为典型的K-选择,体积小,高生育率年轻的个人和怃孵化时间较短的年轻个人典型的r-选择。在植物中,一年生植物,如农田杂草先锋草,原生和次生光土地属于r-选择,大多数树种属于K-选择。

自然选择的结果 - 生物种群的繁殖策略。