怎么用r语言计算关键词数量

Python015

怎么用r语言计算关键词数量,第1张

安装和启动比spss快很多。

上课时,老师:“先不下R studio了,这个初学够用。”

哈哈哈哈哈好的。

程序可以不难学,反正我不太喜欢上来就搞最难的,零基础小白菜得安详。

哎呀,这个课老师真的超可爱,先介绍了“R当计算器比电脑自带的好用多了!”,安利了一波计算器使用方法,像极了分享自己宝贝玩具的大男孩。

R当做计算器也的确简单。把脑子里想的数学公式打进去按回车就行了。

数学函数表示方式可能得查一下。百度必应谷歌,一搜解千愁。

常见:pi --π ;sqrt(2)=根号2;log()=ln();exp()=e^x.

说起来这些对我来说也不常用,用不到的知识又增加了

好了,

1、基础概念之向量,Vectors:【向量是一串有序数据,向量内】

R里vectors分三种,数值、逻辑值、字符串,英文分别是

Numeric vectors

Logical vectors

Character vectors。

mode(x)语句可查看哪一类。

R里的向量表示方式:

输入数值可直接 c(1,2),字符串需要加单/双引号:c('hi',"morning")

逻辑值按回车后可判断正误,true false,或者NA(not available)。

2、变量、变量名、赋值

变量,咋说呢,定义是“A variable is used to store information”,反正就指代某一大串信息。

接下来,给变量起名字,并赋值。起名字有讲究的。

对了,打字之前,先知道一句R对大小写敏感(大小写敏感是说,大写小写在R看来是不同的东西,Yes 不等于 yes ),请把这句话记好。

起名字的规矩其实就三条:

1、可以有√:A-Z, a-z, 0-9, 英文句号 (.) 下划线 (_)

2、不能有×:空格,reserved keywords

3、开头只能是字母或点

(保留字是啥之后再说叭,今天用不到)

好了,现在已经会起名字了。再也不怕变量太多分不清了

那开始把名字和数据配配对。

赋值符号 :"

x=2, x

在R看来一个意思。

那怎么告诉它我想要的是“x小于负二”?

加空格。x<-2

是不是很妙

在我们实际建模拟合时,若数据中某个变量过度离散,则需要做转化,常见的有做log和根号两种方式。

install.packages('gridExtra') 

library(gridExtra) 

#先画一个柱状图,观察friend_count这个变量的整体趋势,发现过度离散

p1<-ggplot(aes(x=friend_count),data=pf)+geom_histogram()

#log转化

p2<-p1+scale_x_log10()

#根号转化

p3<-p1+scale_x_sqrt()

#将三张图放在一个面板里

grid.arrange(p1,p2,p3,ncol=1)

最后我们发现,做了log转化的数据更接近正态分布。

首先order是直接返回位置的可以用which来取到满足条件的下标://定义a和向量ma=2.5m=c(1,2,3,4,5)//求差取绝对值k=abs(m-a)which.min(k)//只返回满足条件一个下标which(k==min(k))//可以返回所有的最小数的下标m[(k==min(k)]//返回所有满足条件的数不好意思,我直接回答了。分不给也不要紧,难道LZ在考试?