R语言分数字符串变小数

Python031

R语言分数字符串变小数,第1张

最近处理数据遇到了分数表示的字符串,希望其能变成小数,现找到如下一些解法

例如,有如下分数字符串,要把它转变为小数

利用 eval(parse()) 函数,不多说

利用 stringr 包中的字符串拆分函数 str_split() 将其拆分并简化

同样利用 str_split() 函数但不简化,之后使用 sapply() 函数简化

直接使用 DOSE 包中现成的函数

利用 sub() 函数查找并保留想要的部分

利用 str_locate() 函数定位“\”符号,之后使用 str_sub() 函数进行字符串截取

在我们实际建模拟合时,若数据中某个变量过度离散,则需要做转化,常见的有做log和根号两种方式。 install.packages('gridExtra')  library(gridExtra)  #先画一个柱状图,观察friend_count这个变量的整体趋势,发现过度离散 p1<-ggplot(aes(x=friend_count),data=pf)+geom_histogram() #log转化 p2<-p1+scale_x_log10() #根号转化 p3<-p1+scale_x_sqrt() #将三张图放在一个面板里 grid.arrange(p1,p2,p3,ncol=1)最后我们发现,做了log转化的数据更接近正态分布。

mutate:变异 突变 改变 数据修改

紧接着创建新的列gain和speed

新创建的列同时也可以使用(但是保留的方法仍然是赋值给某个名称):

由于系统显示限制,最后一列没有展示出来,运行view()函数即可:

如果只想要保留新的变量,那就使用transmute()函数:

此时参与计算的arr_delay、dep_delay、air_time、hours都消失,只有新转换的gain、hours 、gain_per_hour三列。

mutare()函数可以和前面提到的几个函数结合起来使用。其中进行运算的时候,肯定会涉及到R语言的计算语言,以下列出几个常用的:

举例: