最新发布

# 2023-02-09
华为鸿蒙系统支持的中央空调有哪些
华为鸿蒙系统支持的中央空调有美的，日立中央空调等。首款搭载华为鸿蒙系统的智能空调中国尊鸿蒙艺术柜机，已于2021年5月起上市销售，在空调旺季市场上掀起一轮全新的主动智能、新风无风感的智慧新体验。随着美的与华为联手打造的这两大智慧空调操控体验
# 2023-02-09
华为手机开机显示Harmony OS怎么解决
如果您的手机开机进入Harmony OS界面、EMUI界面、FASTBOOT界面，可能因为如下原因：（1）可能是无意按到了开机键+音量键的组合键进入了特殊模式，建议您长按电源键15秒以上，尝试强制重启手机，即可正常进入手机桌面。温馨提醒
# 2023-02-09
HarmonyOs 网络安全配置，允许应用使用明文流量传输
"deviceConfig": { "default": { "process": "xxx", "directLaunch":
# 2023-02-09
鸿蒙OS2.0九大新功能，详细玩机技巧
鸿蒙OS适配后，相比EMUI新增了九大功能！赶快保存或者手机搜索玩机技巧。一、HarmonyOs 桌面提供了服务卡片、大文件夹与小艺建议,让操作更便捷、桌面更美观。服务卡片:无需打开应用,可快速预览应用信息或使用常用功能。将不同
# 2023-02-09
harmonyos是什么意思
harmonyos即鸿蒙系统的意思，正确写法为harmony os。harmony os鸿蒙系统是华为公司在2019年8月9日于东莞举行华为开发者大会（HDC.2019）上正式发布的操作系统。鸿蒙系统面向全场景的分布式操作，将人、设备、
# 2023-02-09
harmonyos是什么意思
harmonyos即鸿蒙系统的意思，正确写法为harmony os。harmony os鸿蒙系统是华为公司在2019年8月9日于东莞举行华为开发者大会（HDC.2019）上正式发布的操作系统。鸿蒙系统面向全场景的分布式操作，将人、设备、
# 2023-02-09
HarmonyOS技术特性
最近,随着华为的一批电子设备升级鸿蒙系统,鸿蒙系统的热度也逐渐升高。这里分享一下鸿蒙系统的定位及底层特性,让人们比较深入的认识一下鸿蒙系统。 HarmonyOS是一款面向万物互联时代的、全新的分布式操作系统。
# 2023-02-09
华为手机开机显示Harmony OS是什么情况?
如果您的手机开机进入Harmony OS界面、EMUI界面、FASTBOOT界面，可能因为如下原因：（1）可能是无意按到了开机键+音量键的组合键进入了特殊模式，建议您长按电源键15秒以上，尝试强制重启手机，即可正常进入手机桌面。温馨提醒
# 2023-02-09
鸿蒙抄袭安卓？看这一篇就够了
01什么是 AOSP ？很多人都说鸿蒙是 AOSP 套壳，那么我们首先得明白什么是 AOSP？ AOSP 是"Android Open Source Project&
# 2023-02-09
华为平板m6能升级鸿蒙吗？
华为平板M6 10.8英寸、华为平板M6 8.4英寸、华为平板M6 高能版可以升级HarmonyOS系统。升级方式：进入设置 &gt系统和更新，点击软件更新。升级HarmonyOS 2前，您的平板需同时满足下列条件：（1）升级版本前

R语言数据集行列互换技巧

2023-02-23 20:27:02Python016

R语言数据集行列互换技巧,第1张

R语言数据集行列互换技巧

现在给大家介绍的数据处理技巧是长转宽，也就相当于Excel中的转置，不过用R语言实现的长转宽还有数据合并的功能，自然比Excel强大多了。

这里给大家介绍4个函数，其中melt()、dcast()来自reshape2包，gather（）、spread()来自tidyr包

一、宽转长——melt()、gather（）

[python] view plain copy

mydata<-data.frame(

name=c("store1","store2","store3","store4"),

address=c("普陀区","黄浦区","徐汇区","浦东新区"),

sale2014=c(3000,2500,2100,1000),

sale2015=c(3020,2800,3900,2000),

sale2016=c(5150,3600,2700,2500),

sale2017=c(4450,4100,4000,3200)

)

#宽转长——melt

mydata1<-melt(

mydata,

id.vars=c("address","name"),#要保留的主字段

variable.name = "Year",#转换后的分类字段名称（维度）

value.name = "Sale" #转换后的度量值名称

)

输出结果

[python] view plain copy

>mydata1<-melt(

+ mydata,

+ id.vars=c("address","name"),#要保留的主字段

+ variable.name = "Year",#转换后的分类字段名称（维度）

+ value.name = "Sale" #转换后的度量值名称

+ )

>mydata1

address name Year Sale

1普陀区 store1 sale2014 3000

2黄浦区 store2 sale2014 2500

3徐汇区 store3 sale2014 2100

4 浦东新区 store4 sale2014 1000

5普陀区 store1 sale2015 3020

6黄浦区 store2 sale2015 2800

7徐汇区 store3 sale2015 3900

8 浦东新区 store4 sale2015 2000

9普陀区 store1 sale2016 5150

10 黄浦区 store2 sale2016 3600

11 徐汇区 store3 sale2016 2700

12 浦东新区 store4 sale2016 2500

13 普陀区 store1 sale2017 4450

14 黄浦区 store2 sale2017 4100

15 徐汇区 store3 sale2017 4000

16 浦东新区 store4 sale2017 3200

再来看看gather（）函数怎么用

[python] view plain copy

>#宽转长——gather

>mydata1<-tidyr::gather(

+ data=mydata,

+ key="Year",

+ value="sale",

+ sale2014:sale2017

+ )

>mydata1

name address Year sale

1 store1 普陀区 sale2014 3000

2 store2 黄浦区 sale2014 2500

3 store3 徐汇区 sale2014 2100

4 store4 浦东新区 sale2014 1000

5 store1 普陀区 sale2015 3020

6 store2 黄浦区 sale2015 2800

7 store3 徐汇区 sale2015 3900

8 store4 浦东新区 sale2015 2000

9 store1 普陀区 sale2016 5150

10 store2 黄浦区 sale2016 3600

11 store3 徐汇区 sale2016 2700

12 store4 浦东新区 sale2016 2500

13 store1 普陀区 sale2017 4450

14 store2 黄浦区 sale2017 4100

15 store3 徐汇区 sale2017 4000

16 store4 浦东新区 sale2017 3200

和melt（）函数不同，gather（）函数需要指定关键字段key,以及关键字段对应的值value，但是gather（）函数更加好理解。

二、长转宽——dcast()和spread()

还是用上面的data1数据集，先来看看dcast()函数

[python] view plain copy

#长转宽——dcast

dcast(

data=mydata1,

name+address~Year

#左侧是要保留的字段，右侧是要分割的分类变量，列数等于表达式

#右侧分类变量的类别个数

)

[python] view plain copy

>#长转宽——dcast

>dcast(

+ data=mydata1,

+ name+address~Year

+ #左侧是要保留的字段，右侧是要分割的分类变量，列数等于表达式

+ #右侧分类变量的类别个数

+ )

Using sale as value column: use value.var to override.

name address sale2014 sale2015 sale2016 sale2017

1 store1 普陀区 3000 3020 5150 4450

2 store2 黄浦区 2500 2800 3600 4100

3 store3 徐汇区 2100 3900 2700 4000

4 store4 浦东新区 1000 2000 2500 3200

dcast()函数的使用规则需要琢磨下才能理解，大家好好看看注释部分，再来看看spread()

[python] view plain copy

#长转宽——spread

tidyr::spread(

data=mydata1,

key=Year,

value=sale

)

[python] view plain copy

>#长转宽——spread

>tidyr::spread(

+ data=mydata1,

+ key=Year,

+ value=sale

+ )

name address sale2014 sale2015 sale2016 sale2017

1 store1 普陀区 3000 3020 5150 4450

2 store2 黄浦区 2500 2800 3600 4100

3 store3 徐汇区 2100 3900 2700 4000

4 store4 浦东新区 1000 2000 2500 3200

直接调用tidyr::spread，需要指定关键字段key和对应的值value。

但是从理解上来看，我个人更喜欢tidyr包的函数，使用很清晰，大家可以根据实际情况自行选择，好啦，今天的分享结束，下次再见！

#读取wet.txt需要转换的目标矩阵，显示原行列。本例中行为sample，列为otu

otu<-read.delim('E:\\R语言网络分析\\wet.txt',sep='\t',row.names=1)

otu1<-t(otu)

write.table(otu1,file='otu9.txt',sep='\t',row.names=T)

#读取wet.xlsx需要转换的目标矩阵，显示原行列。本例中行为sample，列为otu

library(openxlsx)

otu<-read_excel("E:\\R语言网络分析\\wet.xlsx")

otu1=t(otu)

##导出已转置文件到本地储存，此处导出的文件为Excel格式文件

write.xlsx(otu1,file="otu11.xlsx",sep='\t',row.names=T)

# 将otu1保存为csv文件

write.csv(otu1,file="otu11.csv")

library(openxlsx)

otu<-read_excel("E:\\R语言网络分析\\wet.xlsx")

head(otu)

class(otu)

otu1=t(otu)

write.xlsx(otu1,file="otu2.xlsx") ##导出已转置文件到本地储存，此处导出的文件为Excel格式文件

# 将otu1保存为csv文件

write.csv(otu1,file="otu5.csv")

在群里看到了一个问题，他用R语言的转置函数 t() 对下面形式的数据进行了转置

转置之后的数据结构如下

他发现转置之后多了一行，也就是有了geneid这一行，和他预期的不符合。按照预期，geneid这一行应该是成为列名，而不是作为输出的第一行。那么，为什么会出现这个情况呢？这就需要从 t() 这个函数说起。

使用 ?t ，你会得到关于这个函数的函数说明。在函数的Detials部分中，有这样一段

即，数据框会先用 as.matrix() 转成矩阵格式，然后再引用 t() ，最终你对一个数据框使用 t() 函数时，你会得到一个矩阵，而非原先的data.frame.

举个例子:

因为矩阵要求存放的内容是同一种数据类型，对于输入的数据框而言，一般都会有字符串，数值这些，那么最终都会被转成字符串。

对于最开始的问题而言，因为原先的数据框的第一列是字符串，那么自然而然会把所有的数据都变成字符串，然后把第一列变成第一行。而如果要实现他真正的目的，需要先将第第一行变成行名，然后删掉第一行在转置，也就是

其结果就是先保证原来的数据框里面都是数值数据，而不是让第一列充当行名。

延伸一下，对于超过2维的数组，我们要用到 aperm 函数才能对数据进行转置。当然，超过二维的转置，你甚至都无法直观感受到这是一个什么过程。

黄浦区普陀区徐汇区浦东新区函数

# 上一篇：hbase是什么意思

# 下一篇：python绘图篇