怎么用r语言计算关键词数量

2023-02-24 23:53:01Python021

怎么用r语言计算关键词数量,第1张

安装和启动比spss快很多。

上课时，老师：“先不下R studio了，这个初学够用。”

哈哈哈哈哈好的。

程序可以不难学，反正我不太喜欢上来就搞最难的，零基础小白菜得安详。

哎呀，这个课老师真的超可爱，先介绍了“R当计算器比电脑自带的好用多了！”，安利了一波计算器使用方法，像极了分享自己宝贝玩具的大男孩。

R当做计算器也的确简单。把脑子里想的数学公式打进去按回车就行了。

数学函数表示方式可能得查一下。百度必应谷歌，一搜解千愁。

常见：pi --π ；sqrt(2)=根号2；log()=ln()；exp()=e^x.

说起来这些对我来说也不常用，用不到的知识又增加了

好了，

1、基础概念之向量，Vectors：【向量是一串有序数据，向量内】

R里vectors分三种，数值、逻辑值、字符串，英文分别是

Numeric vectors

Logical vectors

Character vectors。

mode(x)语句可查看哪一类。

R里的向量表示方式：

输入数值可直接 c(1,2),字符串需要加单/双引号：c('hi',"morning")

逻辑值按回车后可判断正误，true false，或者NA(not available)。

2、变量、变量名、赋值

变量，咋说呢，定义是“A variable is used to store information”，反正就指代某一大串信息。

接下来，给变量起名字，并赋值。起名字有讲究的。

对了，打字之前，先知道一句R对大小写敏感(大小写敏感是说，大写小写在R看来是不同的东西，Yes 不等于 yes )，请把这句话记好。

起名字的规矩其实就三条：

1、可以有√：A-Z, a-z, 0-9, 英文句号 (.) 下划线 (_)

2、不能有×：空格，reserved keywords

3、开头只能是字母或点

(保留字是啥之后再说叭，今天用不到)

好了，现在已经会起名字了。再也不怕变量太多分不清了

那开始把名字和数据配配对。

赋值符号："

x=2， x

在R看来一个意思。

那怎么告诉它我想要的是“x小于负二”？

加空格。x<-2

是不是很妙

R语言字符串处理常用函数

R语言中常用的字符串处理函数：

（1）得到字符串长度：nchar()

# 生成示范字符串

（2）剪切字符串：strsplit()

# 对字符串进行剪切

（3）得到子字符串：substr()

# 得到子字符串

（4）判断字符串中是否有某个字串:grepl()

# 判断字符串中是否有某个字串

（5）字符串替换：gsub()

（6）字符串定位

在Hmisc包里，有一个函数可以很方便的对文本的的目标字符串进行定位，substring.location()

vector：向量 numeric：数值型向量 logical：逻辑型向量 character；字符型向量 list：列表 data.frame：数据框

c：连接为向量或列表 sequence：等差序列 rep：重复

length：求长度 subset：求子集 seq，from:to， NA：缺失值 NULL：空对象 sort，order，unique，rev：排序 unlist：展平列表 attr，attributes：对象属性

mode，typeof：对象存储模式与类型 names：对象的名字属性

character：字符型向量 nchar：字符数 substr：取子串 format，formatC：把对象用格式转换为字符串 paste，strsplit：连接或拆分

charmatch，pmatch：字符串匹配 grep，sub，gsub：模式匹配与替换

complex，Re，Im，Mod，Arg，Conj：复数函数

factor：因子 codes：因子的编码 levels：因子的各水平的名字 nlevels：因子的水平个数 cut：把数值型对象分区间转换为因子

table：交叉频数表 split：按因子分组 aggregate：计算各数据子集的概括统计量 tapply：对“不规则”数组应用函数

+, -, *, /, ^, %%, %/%：四则运算 ceiling，floor，round，signif，trunc，zapsmall：舍入 max，min，pmax，pmin：最大最小值

range：最大值和最小值 sum，prod：向量元素和，积 cumsum，cumprod，cummax，cummin：累加、累乘 sort：排序 approx和approx fun：插值 diff：差分 sign：符号函数

abs，sqrt：绝对值，平方根 log, exp, log10, log2：对数与指数函数 sin，cos，tan，asin，acos，atan，atan2：三角函数

sinh，cosh，tanh，asinh，acosh，atanh：双曲函数

beta，lbeta，gamma，lgamma，digamma，trigamma，tetragamma，pentagamma，choose ，lchoose：与贝塔函数、伽玛函数、组合数有关的特殊函数

fft，mvfft，convolve：富利叶变换及卷积 polyroot：多项式求根 poly：正交多项式 spline，splinefun：样条差值

besselI，besselK，besselJ，besselY，gammaCody：Bessel函数 deriv：简单表达式的符号微分或算法微分

array：建立数组 matrix：生成矩阵 data.matrix：把数据框转换为数值型矩阵 lower.tri：矩阵的下三角部分 mat.or.vec：生成矩阵或向量 t：矩阵转置

cbind：把列合并为矩阵 rbind：把行合并为矩阵 diag：矩阵对角元素向量或生成对角矩阵 aperm：数组转置 nrow, ncol：计算数组的行数和列数 dim：对象的维向量

dimnames：对象的维名 row/colnames：行名或列名 %*%：矩阵乘法 crossprod：矩阵交叉乘积（内积） outer：数组外积 kronecker：数组的Kronecker积

apply：对数组的某些维应用函数 tapply：对“不规则”数组应用函数 sweep：计算数组的概括统计量 aggregate：计算数据子集的概括统计量 scale：矩阵标准化

matplot：对矩阵各列绘图 cor：相关阵或协差阵 Contrast：对照矩阵 row：矩阵的行下标集 col：求列下标集

solve：解线性方程组或求逆 eigen：矩阵的特征值分解 svd：矩阵的奇异值分解 backsolve：解上三角或下三角方程组 chol：Choleski分解

qr：矩阵的QR分解 chol2inv：由Choleski分解求逆

<，>，<=，>=，==，!=：比较运算符 !，&，&&，|，||，xor()：逻辑运算符 logical：生成逻辑向量 all，any：逻辑向量都为真或存在真

ifelse()：二者择一 match，%in%：查找 unique：找出互不相同的元素 which：找到真值下标集合 duplicated：找到重复元素

optimize，uniroot，polyroot：一维优化与求根

if，else，ifelse，switch：分支 for，while，repeat，break，next：循环 apply，lapply，sapply，tapply，sweep：替代循环的函数。

function：函数定义 source：调用文件 call：函数调用 .C，.Fortran：调用C或者Fortran子程序的动态链接库。 Recall：递归调用

browser，debug，trace，traceback：程序调试 options：指定系统参数 missing：判断虚参是否有对应实参 nargs：参数个数 stop：终止函数执行

on.exit：指定退出时执行 eval，expression：表达式计算 system.time：表达式计算计时 invisible：使变量不显示 menu：选择菜单（字符列表菜单）

其它与函数有关的还有：delay，delete.response，deparse，do.call，dput，environment ，，formals，format.info，interactive，

is.finite，is.function，is.language，is.recursive ，match.arg，match.call，match.fun，model.extract，name，parse，substitute，sys.parent ，warning，machine

cat，print：显示对象 sink：输出转向到指定文件 dump，save，dput，write：输出对象 scan，read.table，load，dget：读入

ls，objects：显示对象列表 rm, remove：删除对象 q，quit：退出系统 .First，.Last：初始运行函数与退出运行函数。

options：系统选项 ?，help，help.start，apropos：帮助功能 data：列出数据集分析

每一种分布有四个函数：d――density（密度函数），p――分布函数，q――分位数函数，r――随机数函数。

比如，正态分布的这四个函数为dnorm，pnorm，qnorm，rnorm。下面我们列出各分布后缀，前面加前缀d、p、q或r就构成函数名：

norm：正态，t：t分布，f：F分布，chisq：卡方（包括非中心） unif：均匀，exp：指数，weibull：威布尔，gamma：伽玛，beta：贝塔

lnorm：对数正态，logis：逻辑分布，cauchy：柯西， binom：二项分布，geom：几何分布，hyper：超几何，nbinom：负二项，pois：泊松 signrank：符号秩，

wilcox：秩和，tukey：学生化极差

sum, mean, var, sd, min, max, range, median, IQR（四分位间距）等为统计量，sort，order，rank与排序有关，其它还有ave，fivenum，mad，quantile，stem等。

R中已实现的有chisq.test，prop.test，t.test。

cor，cov.wt，var：协方差阵及相关阵计算 biplot，biplot.princomp：多元数据biplot图 cancor：典则相关 princomp：主成分分析 hclust：谱系聚类

kmeans：k-均值聚类 cmdscale：经典多维标度其它有dist，mahalanobis，cov.rob。

ts：时间序列对象 diff：计算差分 time：时间序列的采样时间 window：时间窗

lm，glm，aov：线性模型、广义线性模型、方差

函数向量矩阵字符串数组

# 上一篇：python3字典遍历

# 下一篇：JAVA实现点赞功能 if语句

推荐阅读

热门文章

最新发布

标签列表

怎么用r语言计算关键词数量

给您推荐相同类型的内容：