简单说就是R语言和Spark的一个接口,可以通过R语言调用Spark的计算能力,把计算任务分配到Spark的节点上来做。
亮点:
1、近乎完整的dplyr语法!用过dplyr的同学一定知道这套语法是多么的人性化…
2、可以直接调用Spark的机器学习能力!再也不用纠结pull到R里面的数据不够...
3、不要钱……
弱点:
1、如果不是Spark包自带的算法的话还是要自己Call Spark API写…要懂一点分布式开发
2、仔细一想这就是给Spark做了个壳...不能说是用R在做分布式运算orz
至于Microsoft...现在有Microsoft R Server, 提供了很多R原生函数的High Performance Analysis版本,可以实现并行运算...
r语言contains函数用法根据特定条件选择列。r语言contains包含以下函数,pull以向量的形式提取列值.可以通过名称或索引指定感兴趣的列。select将一个或多个列提取为一个数据表。它还可以用于从数据框架中删除列。select_if根据特定条件选择列。例如,可以使用这个函数来选择列(如果它们是数值型的)。pull 、grab、 hold的区别具体如下:pull 英 [pʊl] 美 [ pʊl]
vt.&vi.拉扯拉过来划(船)
vt.赢得吸引异性取消(耍手腕)得逞
n.拖爬影响力
例句:
Hughes pulled himself slowly to his feet
休斯慢慢站了起来。
grab 英 [græb] 美 [ɡræb]
vt.&vi.抢先,抢占
vt.夺取或抓住抢夺,霸占匆匆拿走〈俚〉吸引注意力
vi.夺取抓住,攫取
n.不法所得被抓住的人抓取装置
例句:
I jumped on the wall to grab the attention of the crowd.
为了吸引那群人的注意,我纵身跃上墙头。
hold 英 [həʊld] 美 [hoʊld]
vt.容纳拿住,握住保留,保存扣留,拘押
vi.拿住,握住同意,赞成保持不变有效
n.握住保留控制
例句:
If only he would hold her close to him.
要是他能将她拥入怀中就好了。