怎么用r语言计算关键词数量

Python013

怎么用r语言计算关键词数量,第1张

安装和启动比spss快很多。

上课时,老师:“先不下R studio了,这个初学够用。”

哈哈哈哈哈好的。

程序可以不难学,反正我不太喜欢上来就搞最难的,零基础小白菜得安详。

哎呀,这个课老师真的超可爱,先介绍了“R当计算器比电脑自带的好用多了!”,安利了一波计算器使用方法,像极了分享自己宝贝玩具的大男孩。

R当做计算器也的确简单。把脑子里想的数学公式打进去按回车就行了。

数学函数表示方式可能得查一下。百度必应谷歌,一搜解千愁。

常见:pi --π ;sqrt(2)=根号2;log()=ln();exp()=e^x.

说起来这些对我来说也不常用,用不到的知识又增加了

好了,

1、基础概念之向量,Vectors:【向量是一串有序数据,向量内】

R里vectors分三种,数值、逻辑值、字符串,英文分别是

Numeric vectors

Logical vectors

Character vectors。

mode(x)语句可查看哪一类。

R里的向量表示方式:

输入数值可直接 c(1,2),字符串需要加单/双引号:c('hi',"morning")

逻辑值按回车后可判断正误,true false,或者NA(not available)。

2、变量、变量名、赋值

变量,咋说呢,定义是“A variable is used to store information”,反正就指代某一大串信息。

接下来,给变量起名字,并赋值。起名字有讲究的。

对了,打字之前,先知道一句R对大小写敏感(大小写敏感是说,大写小写在R看来是不同的东西,Yes 不等于 yes ),请把这句话记好。

起名字的规矩其实就三条:

1、可以有√:A-Z, a-z, 0-9, 英文句号 (.) 下划线 (_)

2、不能有×:空格,reserved keywords

3、开头只能是字母或点

(保留字是啥之后再说叭,今天用不到)

好了,现在已经会起名字了。再也不怕变量太多分不清了

那开始把名字和数据配配对。

赋值符号 :"

x=2, x

在R看来一个意思。

那怎么告诉它我想要的是“x小于负二”?

加空格。x<-2

是不是很妙

q1, dexp是指数分布的概率密度;

r*是生成*分布的随机数,p是*分布的概率分布,d是概率密度,还有q是d的反函数,貌似

R可向量操作,数乘向量是用数乘向量内的每个元素

q2, pi在R里是一个常量,可直接用,3.141593,没有你要求的精度高,你可pi<-3.1415926535...

q3, 不会

q4, integrate 函数能算数值积分;蒙特卡洛积分我不会,甚至都没听过,不是数学专业的,正常正常...

以 ∫ e^(-x) dx 上限: 无限, 下限:0为例啊;

f<-function(x) {exp(-x)}

integrate(f, lower=0, upper=Inf)

若是 ∫ e^(-x^3) dx的话,

f<-function(x) {exp(-x^3)}

就行了

最近身体状况不太好的我,已经懒惰到不太想用脑子思考问题了,但也总不能什么事情都不做就这样蹉跎岁月吧,于是想着把自己之前的知识总结总结。今天就先把R语言的知识总结总结吧。

R语言是一个应用非常广泛的并且免费的用于统计计算和作图的计算机语言,无论什么和数据分析有关的行业,基本都会用到R。R 环境由一组数据操作,计算和图形展示的工具构成。它的特色在于:1.有效的数据处理和保存机制;2.完整的数组和矩阵计算操作符;3.连贯而又完整的数据分析工具;4.图形工具可以对数据直接进行分析和展示,同时可用于多种图形设备;5.它是一种相当完善,简洁而又高效的程序设计语言(也就是‘S’)。

基本的数据类型:

向量有一些基本运算:

求三角函数的值:sin(x),cos(x),tan(x)

向量开根号:sqrt(x)

求向量的和:sum(x)

向量的最大值和最小值:max(x) 和min(x)。

向量的范围:range (x)

向量的长度:length(x)

向量的均值:mean(x)

向量的方差:var(x)

向量的标准差:sd(x)

向量的累乘:prod(x)

数组可以看作是带有多个下标类型相同的元素集合,如数值型。

维度向量(dimension vector)是一个正整数向量。如果它的长度为k,那么该数组就是k-维的,例如矩阵是2-维数组。

数组只允许单一类型的值出现。

在R中数组用array()函数建立。

矩阵是一个2维的数组,一般用matrix()来构建一个矩阵,array()也可以创建一个2维数组(矩阵)。

例子:定义一个从1到20,行数为4,列数为5的矩阵。

向量的合并:

也可以用cbind()和rbind()函数将相同长度的向量接合成矩阵。

t()可以将矩阵进行转置,或用aperm()代替。

同样矩阵也可以做合并,同样是用rbind和cbind。

rbind和cbind,除能合并等长的向量外,还能合并数据框和矩阵。

矩阵工具:1).函数nrow(A) 和ncol(A) 将会分别返回矩阵A 的行数和列数.2).colnames(A)rownames(A)会分别返回矩阵A 的列名和行名。3).将一个数组强制转换成简单向量的标准方法是用函数as.vector(),或用c()。

因子(factor)是一个对等长的其他向量元素进行分类(分组)的向量对象。 R同时提供有序(ordered)和无序(unordered)因子。有序意味着以字母排序。

函数factor()引入因子。

函数levels()表示因子的水平。

有序因子:函数ordered() 用来创建有序因子。在其他方面,函数ordered() 和factor() 基本完全一样。大多数情况下,有序和无序因子的唯一差别在于前者显示的时候反应了各水平的顺序。

7.1. R 的列表(list)是一个以对象的有序集合构成的对象。列表中包含的对象又称为它的分量(components)。

7.2. 分量可以是不同的模式或类型,如一个列表可以同时包括数值向量,逻辑向量,矩阵,复向量,字符数组,函数等等。

7.3. 列表的建立采用list()函数,列表通过[[index/name]]进行访问。

8.1. 数据框(data frame)是一个属于“data.frame” 类的列表。

8.2. 数据框常常会被看作是一个由不同模式和属性的列构成的矩阵。它能以矩阵形式出现,行列可以通过矩阵的索引习惯访问。

8.3. 用data.frame()函数构建数据框。