R语言_table()函数与因子变量

Python011

R语言_table()函数与因子变量,第1张

今天在写一个求众数的函数,思路很简单:统计unique数值,并计算其频数,取最大值就是,函数如下:

众数值没有问题,但是此处出现了因子水平levels,函数最后一步提取的应该是[1,1]位置的数值才对。怎么出现因子水平呢???

首先检验下众数

问题出现在table函数上,table函数作用就是统计一组向量中unique元素的数量,具体参数请参照R帮助文件。R中这样解释table函数 , “ table uses the cross-classifying factors to build a contingency table of the counts at each combination of factor levels ”。 因此,table()返回的结果是带有因子水平的。

这时候,当然想把因子变量转换成数值变量, as.numeric() , 这时候神奇的事情发生了:

此处呼叫万能的网友,知乎博主[醉一心],CSDN博主[YaoRaoLov]给出了答案。参照以下博文:

https://zhuanlan.zhihu.com/p/147799787

https://ask.csdn.net/questions/707550?sort=comments_count

再来看下table()返回的数据框e

因子型变量在unclass()函数的作用下,显示出真面目:原来就是 一个个数值型变量

这也就是为什么对其进行数值型转化时会得到1,2,3,4等一系列数值的原因。

它的 真实值存储在Levels里面

上述众数函数修改为下

table()的输出可以看成是一个带名字的数字向量。可以用names()和as.numeric()分别得到名称和频数:

>x <- sample(c("a", "b", "c"), 100, replace=TRUE)

>names(table(x))

[1] "a" "b" "c"

>as.numeric(table(x))

[1] 42 25 33

或者,可以直接把输出结果转化为数据框,as.data.frame():

>as.data.frame(table(x))

x Freq

1 a 42

2 b 25

3 c 33

作者:王冠嵩

链接:http://www.zhihu.com/question/46661384/answer/103506127

来源:知乎

著作权归作者所有,转载请联系作者获得授权。

r语言csv数据变成table数据方法如下:

1、可以使用R语言的read.table()函数,将csv文件读入R中。

2、再使用data.frame()函数将其转换为table数据。

3、例如:```data 回答于 2023-01-15