如何使用R计算香农熵?

Python010

如何使用R计算香农熵?,第1张

1.1948 年,香农提出了“ 信息熵 ”(shāng);

2.信息量的度量就等于不确定性的多少。即:要搞懂一个非常非常不确定(gaoleng)的女孩(或是说我们一无所知的女神),就需要了解大量的信息(喜欢吃啥,衣品,喜欢的偶像)。相反,如果我们对某件事已经有了较多的了解(女闺蜜/青梅竹马的),我们不需要太多的信息就能把它搞清楚。(我尽力了~)

library(entropy)

因为我的数据集有683个基因,所以每一行计算香农熵共683次

y=rep(0,683)

for (i in 1:683){ y[i]=entropy(forentropy[i,],method=c("CS"))}

这时候已经变成是你想要的数据了~

write.table(y, file ="CS_Entropy.txt", sep =",", row.names =FALSE, col.names =FALSE)

就是Excel打开这个香农熵值的表格,复制黏贴到原来的Excel表格中(高端操作就是用cbind到原来的数据集中)

能够解决问题的方法,就是好方法~

这个操作,其实基本上可以用于对任何“感兴趣”函数,对自己的数据集“操作”一下~

不打赏,不点赞,你们还想不想我写了,呜呜呜~~~

1.百度百科香农熵:https://baike.baidu.com/item/香农熵;

一般地, TOPSIS综合评价法 主要包含两个步骤:计算权重和计算相对接近度。如需详细了解 TOPSIS综合评价法 的原理和方法,请自行百度,网上有许多非常详尽的原理说明和案例讲解。

根据熵权法确定各个指标的权重;计算各指标信息熵,指标的信息熵越小,则该指标表达信息的不确定性小,在综合评价中对决策的帮助更大,即应该有较大的权重。熵权法是一种客观的赋予权重的方法,它通过各个指标所提供的信息不确定性来确定各指标的权重

根据权重加权规范化指标属性矩阵后,确定正理想方案Amax和负理想方案 Amin,计算各备选方案与Amax 、Amin的距离,以评估与正负理想方案的接近程度,根据相对接近度确定优先次序。其中计算距离一般使用欧式距离。

按照惯例,导入需要使用的包 data.table 、 plyr 。然后载入使用的数据,我们简单看一下案例数据情况。

其中的字段target即为目标字段,我们需要对其含有的8个方案(A~H)进行综合评价排序,选择其中的最优方案。该数据集中的指标均为正向指标。正向指标表示指标的数值越高越好,负向指标则表示指标的数值越低越好,这决定了该指标在进行权重计算时的处理方式。

计算权重的第一步是计算各个指标的熵值,由于我们用到的指标均是正向指标,所以选择自定义函数 entropy_positive 即可。如果指标既存在正向指标又存在负向指标,则可分开进行计算。自定义函数情况如下:

调用函数并完成权重的计算,x1~x8的权重依次为:11.10%、6.61%、28.19%、7.08%、11.88%、8.11%、11.94%、15.09%,计算过程如下:

在将指标向量规范化后,利用熵值法得到的权重计算得到加权标准化矩阵,然后提取正理想方案和负理想方案并计算出各个方案距离正负理想方案的距离,最终根据计算得到距离比值进行排序。具体计算过程如下:

至此,我们就完成了用 TOPSIS综合评价法 进行多对象多指标的最优对象选择,输出的结果如下,显然在这八个方案中,方案A为最优方案。