1、使用R语言(RStudio)运行read.csv()读取数据,发现代码运行出错。
2、输入View(x)却发现数据的左上角第一个数字出错有乱码,这才导致NAnotpermittedinpredictors。
3、可以使用matlab迂回的办法解决,首先在matlab中新建一个空矩阵,将数据复制到(读取到)此矩阵中。
4、然后,使用csvwrite(实验数据2.csv,A);将此数据再次输出(注意路径)。
5、接着再次读入R语言中,展开数据,数据报错问题就解决了。
读取表格 坑1:列名称不对,使用了R不能识别的列名1 | follow_table <- read.csv("follow_table.csv", header = T)
返回
follow_table <- read.csv("follow_table.csv", header = T)
Error in make.names(col.names, unique = TRUE) :
invalid multibyte string 2
返回表格,把列名中含数字的都去掉,改成字母+下划线就好了。
读取表格坑2 :
orignal_table <- read.csv("original_table.csv",header = T)
Error in read.table(file = file, header = header, sep = sep, quote = quote, :
列的数目比列的名字要多
后来看了,表格为逗号分隔符,加上 sep = "," ,还是没好,把表头 设置成 header = F 就好了
orignal_table <- read.csv("original_table.csv",sep=",", header = F)
这样读取的表格还是不行,因为第一列的列名为乱码。
百度搜索了解决办法,[R语言读取csv文件,第一列列名出现乱码的解决方法] ( Rhttps://blog.csdn.net/weixin_45075290/article/details/90695638 )
原来是因为只是把表格另存为csv是不行了,需要把表格导出为CSV的格式。
两个表格通过同一个列名合并,最终得到的是其同一列名交集的最终对应的变量。