怎么用r语言计算关键词数量

Python014

怎么用r语言计算关键词数量,第1张

安装和启动比spss快很多。

上课时,老师:“先不下R studio了,这个初学够用。”

哈哈哈哈哈好的。

程序可以不难学,反正我不太喜欢上来就搞最难的,零基础小白菜得安详。

哎呀,这个课老师真的超可爱,先介绍了“R当计算器比电脑自带的好用多了!”,安利了一波计算器使用方法,像极了分享自己宝贝玩具的大男孩。

R当做计算器也的确简单。把脑子里想的数学公式打进去按回车就行了。

数学函数表示方式可能得查一下。百度必应谷歌,一搜解千愁。

常见:pi --π ;sqrt(2)=根号2;log()=ln();exp()=e^x.

说起来这些对我来说也不常用,用不到的知识又增加了

好了,

1、基础概念之向量,Vectors:【向量是一串有序数据,向量内】

R里vectors分三种,数值、逻辑值、字符串,英文分别是

Numeric vectors

Logical vectors

Character vectors。

mode(x)语句可查看哪一类。

R里的向量表示方式:

输入数值可直接 c(1,2),字符串需要加单/双引号:c('hi',"morning")

逻辑值按回车后可判断正误,true false,或者NA(not available)。

2、变量、变量名、赋值

变量,咋说呢,定义是“A variable is used to store information”,反正就指代某一大串信息。

接下来,给变量起名字,并赋值。起名字有讲究的。

对了,打字之前,先知道一句R对大小写敏感(大小写敏感是说,大写小写在R看来是不同的东西,Yes 不等于 yes ),请把这句话记好。

起名字的规矩其实就三条:

1、可以有√:A-Z, a-z, 0-9, 英文句号 (.) 下划线 (_)

2、不能有×:空格,reserved keywords

3、开头只能是字母或点

(保留字是啥之后再说叭,今天用不到)

好了,现在已经会起名字了。再也不怕变量太多分不清了

那开始把名字和数据配配对。

赋值符号 :"

x=2, x

在R看来一个意思。

那怎么告诉它我想要的是“x小于负二”?

加空格。x<-2

是不是很妙

R语言数组矩阵

1 数组

数组可以看成一个由递增下标表示的数据项的集合,例如数值。

数组的生成

如果一个向量需要在R中以数组的方式被处理,则必须含有一个维数向量作为它的dim属性。

维度向量由dim()指定,例如,z是一个由1500个元素组成的向量。下面的赋值语句

>dim(z) <- c(3,5,100)使它具有dim属性,并且将被当作一个3X5X100的数组进行处理。 c(3,5,100) 就是他的维度向量。

还可以用到像matrix()和array()这样的函数来赋值。比如

>array(1:20, dim=c(4,5))

>matrix(1:24, 3,4)

数据向量中的值被赋给数组中的值时,将遵循与FORTRAN相同的原则"主列顺序",即第一个下标变化的最快,最后的下标变化最慢。

数组的运算

数组可以在算数表达式中使用,结果也是一个数组,这个数组由数据向量逐个元素的运算后组成,通常参与运算的对象应当具有相同的dim属性。

2 数组的索引和数组的子块

数组中的单个元素可以通过下标来指定,下标由逗号分隔,写在括号内。

我们可以通过在下标的位置给出一个索引向量来指定一个数组的子块,不过如果在任何一个索引位置上给出空的索引向量,则相当于选取了这个下标的全部范围。

如a[2,,],a[,3,]等

3 索引数组

除了索引向量,还可以使用索引数组来指定数组的某些元素。

例如:有4X5的数组a,若要得到a中的a[1,3], a[2,2] 和a[3,1]这三个元素,可以生成索引向量i,然后用a[i]得到它们。

>a <- array(1:20,dim=c(4,5)) # Generate a 4 by 5 array.

>i <- array(c(1:3,3:1),dim=c(3,2))

>i

[,1] [,2]

[1,] 1 3

[2,] 2 2

[3,] 3 1

>a[i]

[1] 9 6 3

>a[i] <- 0 # 将这三个元素用0替换。

4 向量,数组的混合运算

表达式从左到右被扫描;

参与运算的任意对象如果大小不足,都将被重复使用直到与其他参与运算的对象等长;

当较短的向量和数组在运算中相遇时,所有的数组必须具有相同的dim属性,否则返回一个错误;

如果有任意参与运算的向量比参与运算的矩阵或数组长,将会产生错误;

如果数组结构正常声称,并且没有错误或者强制转换被应用于向量上,那么得到的结果与参与运算的数组具有相同的dim属性。

5 矩阵的运算

构建分区矩阵:cbind()和rbind(),cbind()按照水平方向,或者说按列的方式将矩阵连接到一起。rbind()按照垂直的方向,或者说按行的方式将矩阵连接到一起。

外积:操作符是%o%:

>ab <- a %o% b 或者

>ab <- outer(a, b, "*")

其中的乘法操作可以由任意一个双变量的函数替代。

广义转置:函数t(A),或aperm(A, c(2,1));

获取行数/列数:nrow(A)和ncol(A)分别返回矩阵A的行数和列数。

矩阵乘法:操作符为%*%;

交叉乘积(cross product):crossprod(X,Y)等同于t(X) %*% y,crossprod(X)等价于crossprod(X, X);

diag(v):如果v是向量,diag(v)返回一个由v的元素为对角元素的对角矩阵。

如果v为矩阵,diag(v)返回一个由v主对角元素组成的向量。

如果v只是一个数值,那么diag(v)是一个vXv的单位矩阵。

特征值和特征向量:eigen(Sm)。这个函数的结果是由名为values和vectors的两部分组成的列表。如果只是需要特征值:eigen(Sm)$values

最小二乘拟合即QR分解:lsfit(), qr()。

强制转换为向量:as.vector(),或者直接c().

z1<-rep(c(2,1,5),4)

z2<-seq(2,30,by =

4)

z3<-rep(c(9,3,5),c(4,2,4))