# c函数用来将元素组成为一个向量
v <- c('a', 'b','c')
print(v)
# 输出结果即为元素的值,可以看出,vector类型里面只能有一种元素
print(class(v))
1
2
3
4
5
1
2
3
4
5
1] “a” “b” “c”
[1] “character”
那么问题来了,假如我就是想什么东西都往向量里面塞呢,这种做法并不会引发报错,但是R会暗中把那些乱七八糟的东西全部转换为一种类型。比如在下面这个例子,R就取了vector的第一个元素,将其转换为了character类型。
在这里插入图片描述
Lists 列表【列表是一个 R 对象,它可以在其中包含许多不同类型的元素,如向量,函数甚至其中的另一个列表。】
# 列表里面就什么都可以塞
l <- list(1,"666",c(2,3,4))
print(l)
print(class(l))
1
2
3
4
1
2
3
4
[[1]]
[1] 1
[[2]]
[1] “666”
[[3]]
[1] 2 3 4
[1] “list”
Matrices 矩阵【矩阵是二维矩形数据集。 它可以使用矩阵函数的向量输入创建。】
# 第一个参数指的是矩阵中的元素内容,第二三个参数指的是矩阵的行和列,最后一个参数指的是按行排列还是按列排列
M = matrix( c('a','a','b','c','b','a'), nrow = 2, ncol = 3, byrow = TRUE)
print(M)
M = matrix( c('a','a','b','c','b','a'), nrow = 2, ncol = 3, byrow = FALSE)
print(M)
print(class(M))
1
2
3
4
5
6
1
2
3
4
5
6
在这里插入图片描述
Arrays 数组【虽然矩阵被限制为二维,但阵列可以具有任何数量的维度。 数组函数使用一个 dim 属性创建所需的维数。】
a <- array(c(1,2,3,4),dim = c(3,3,2))
print(a)
print(class(a))
print(a[2,2,1])
1
2
3
4
1
2
3
4
在这里插入图片描述
Factors 因子【因子是使用向量创建的 r 对象。 它将向量与向量中元素的不同值一起存储为标签。 标签总是字符,不管它在输入向量中是数字还是字符或布尔等。 它们在统计建模中非常有用。】
color <- c('green','green','yellow','red','red','red','green')
f <- factor(color)
print(color)
print(f)
print(nlevels(f))
print(class(s))
1
2
3
4
5
6
1
2
3
4
5
6
在这里插入图片描述
Data Frames 数据帧【数据帧是表格数据对象。 与数据帧中的矩阵不同,每列可以包含不同的数据模式。 第一列可以是数字,而第二列可以是字符,第三列可以是逻辑的。 它是等长度的向量的列表。】
BMI <- data.frame(
gender = c("Male", "Male","Female"),
height = c(152, 171.5, 165),
weight = c(81,93, 78),
Age = c(42,38,26)
)
print(BMI)
print(class(BMI))
1
2
3
4
5
6
7
8
1
2
3
4
5
6
7
8
在这里插入图片描述
参考网址:w3c
打开CSDN,阅读体验更佳
R语言基础之第六部分 分类(史上最全含ddply、aggregate、split、b...
R语言基础之第六部分 分类(史上最全含ddply、aggregate、split、by) 数据: 某市2014年-2018年空气质量指数日数据,需要按年分类计算每年 warm值为1和 0的均值。 数据长这个样子: 目标:求下列的均值 一、数据处理(提取年月) 首先需要...
R语言:数据类型及属性_woooooood的博客
R语言:数据类型及属性 1.数据类型 R语言可以处理的数据类型主要有6种:数值型、整数型、字符型、复数型、逻辑型和原生型 若输入的数据为一个数字,则数据类型为数值型(numeric),若想数据类型为整数(integer),则需要在所赋值后加“L”...
二、数据集与数据类型【R与统计】
引言 按照要求格式来创建含有研究信息的数据集是任何数据分析的第一步。在R中,这个任务包括以下两步: 选择一种数据结构来存储数据; 将数据输入或导入到该数据结构中 因此,本文将先叙述了R中用于存储数据的多种结构,具体为向量、因子、矩阵、数据框以及列表的用法。熟悉这些数据结构和访问其中元素的表述方法将十分有助于了解R的工作方式,便于后续的编程。 我将在下一篇博客介绍一些在R中导入数据的可行方法。手工输入数据当然可以,除此之外,我们也可以从外部源导入数据。数据源可以是文本文件、电子表格、统计软件和各类数据库管
继续访问
R语言中的数据集
R语言中的数据存储形式主要有以下几种方式 数组,向量,矩阵,数据框,列表 R语言中的可以处理的数据类型有以下几种方式 数值类型,字符类型,逻辑类型,原声类型(二进制类型),复数类型 数值类型 包括 实例标示,日期类型 字符类型 包括 标称变量,序数变量 R语言针对不同的数据类型处理的方式是不同的 一、向量(每一个向量中的元素都是相同的数据类型) a b c
继续访问
最新发布 R语言基础数据类型
R语言主要有三种基本的数据类型,分别是数值型(Numeric)、整型(integer)以及字符型(character)。
继续访问
R语言数据类型基础1 数值型、逻辑型与文本型
基础的R语言数据类型操作,包括了字符串、数值向量以及逻辑向量的一点简单介绍
继续访问
R语言----对数据进行分类汇总(GROUP_BY使用)
library(dplyr) ###加载dplyr模块 A<-read.csv("f:\\TEST\\TDD.csv") ####加载数据 D=data.frame(A) ##### A1<-group_by(D,Date_ID) ####分组项 A2<-summarise(A1,cells=n(), ####统计个数 RRC_ch...
继续访问
R语言--R语言数据类型(2)
一、矩阵与数组 创建 # 1.1 利用array函数,创建二维数组m1,每一行记录不同人(A,B,C)的各科成绩(math,english,physics),成绩请随意输入(要求每行至少有一个90分以上,每一列至少有一个60分以下) print('----1.1') m1 <- array(c(95,40,80,55,92,98,86,93,55), dim = c(3,3), dimnames = list(c('A','B','C'),
继续访问
R语言之对象和类
理解什么是对象R是一种基于对象(object)的语言,所以我们在R语言中看到的一切事物都是对象,向量是对象,函数是对象,图形是对象。简单说,我们可以把整个R看成是一个储物室,它的内容是由内在不同的储物盒(对象)组成, 每个盒子有不同属性(attribute), 最重要的一种属性是它的类(class).查看、删除ls:list的缩写,我们要查看物品,所以要先列出目录。
继续访问
R语言中的类和对象
#####类和对象##### #之前学习的字符向量、数值向量、数据框、列表以及数组都是一个类。 #用class函数定义类 teams<-c("PHI","NYM","FLA","ATL","WSN") w<-c(92,89,94,72,59) l<-c(70,73,77,90,102) nleast<-data.frame(teams,w,l) #定义teams类 class(teams) cla
继续访问
R语言数据类型
文章目录基本概念向量字符串矩阵列表数组因子数据框 基本概念 R 语言中的最基本数据类型主要有三种:数字,逻辑,文本 逻辑类型在许多其他编程语言中常称为布尔型(Boolean),常量值只有 TRUE和FALSE。 注意:R 语言区分大小写,true 或 True 不能代表 TRUE。 最直观的数据类型就是文本类型。文本就是其它语言中常出现的字符串(String),常量用双引号包含。 在 R语言中,文本常量既可以用单引号包含,也可以用双引号包含,例如: 按对象类型来分是以下6种:向量(vector),列表(
继续访问
R语言分类汇总
R语言分类汇总 ##加载包 library(dplyr) ##函数 group_by 制定数据集 data 中针对 type 变量进行分类汇总 grou <- group_by(data,type) ##summarise函数计算分类结果——sd 标准差,还可计算其他类,分类汇总 type_sd <- summarise(grou ,sd(range ,na.rm = T)) dat...
继续访问
热门推荐 R语言:排序、筛选以及分类汇总操作
在Excel中我们可以很方便的对数据进行排序、筛选、分类汇总等基本操作,R语言中没有这种傻瓜式的一键操作,如何才能完成这种操作?一、排序1、单变量序列排序单变量序列的排序常用到rank、sort和order函数。给一个例子:>a <- c(3, 1, 5) >rank(a) [1] 2 1 3 >sort(a) [1] 1 3 5 >order(a...
继续访问
R语言 查看与转换数据类型
数据对象类型 R语言的对象常见的数据类型有:数值型、字符型、逻辑型、整数型、复数型等。此外,也可能是缺省值(NA) 数据对象类型及其判别和转化函数 类型 中文释义 示例 辨别 转换 numeric 数值型 2、-3、4.5 is.numeric() as.numeric() character 字符型 “ZhangHenghua” is.character() as.chara...
继续访问
R语言的数据类型
一、数据类型 概括来说,R可以识别六种基本的数据类型,分别是,双整型(double)、整型(integer)、字符型(character)、逻辑型(logical)、复数类型(complex)以及原始类型(raw). 1.双整型(double) 储存普通数值型数据,可正可负,可大可小,可含小数可不含 R中键入的任何一个数值都默认以double型存储 想知道某个对象是什么类型,可以使用typeof() 函数进行查看 在数据科学里,它更常被称为数值型(numeric) 2.整型(integer) 顾名思义,只能
继续访问
R语言——数据类型详解
R语言——数据类型详解 R语言支持的数据类型 数值型 整数型 逻辑型 字符型 复数型 原生型 R语言的数据对象类型包括 向量:一个向量只能有一种数据类型 矩阵:一个矩阵只能有一种数据类型 数组:一个数组只能有一种数据类型 数据框:不同的列允许不同的数据类型 因子:一个因子只能有一种数据类型 列表:允许不同的数据类型 如上图所示,标量、向量、矩阵和数组可以按同一类型来理解,这四种类型要求对象包含的数据均为同一类型,数组是多维度的一串数据,向量是维度为1的数组,标量是单元素的向量,矩阵是维度为2的数
继续访问
R语言自用笔记:复数
介绍了R语言中虚数的表示、相关函数
继续访问
[R语言]2. R语言中的数据类型和数据结构
R语言中数据类型和数据结构是两种不同的概念,初学者经常容易搞混,因此有必要对这两个概念进行详细说明。
继续访问
R语言数据类型:Logical、Numeric、Integer、Complex、Character、Vectors、Lists、Matrices、Arrays、Factors、DataFrames
R语言数据类型:Logical、Numeric、Integer、Complex、Character、Vectors、Lists、Matrices、Arrays、Factors、DataFrames 通常,在使用任何编程语言进行编程时,都需要使用各种变量来存储各种信息。变量只不过是用来存储值的内存位置或者区间。这意味着,当我们创建一个变量时,系统在内存中保留了一些空间。 我们可能喜欢存储各种数据类型的信息,如字符、宽字符、整数、浮点、双浮点、布尔等。根据变量的数据类型,操作系统进行内存的分配并
继续访问
R语言 常用数据类型
一般来讲,R语言中有三种数据结构,第一种是数组,第二种是列表,第三种是数据框。第一种: 数组(包括向量和矩阵)。数组可以用来储存数值型(numeric)、逻辑型(logical)和字符型(character)三种类型的数据。例如:储存字符型数据 >x = array(rep("a",6),dim=c(2,3)) >x [,1] [,2] [,3] [1,] "a" "a" "a"
使用data.frame函数就可以初始化一个Data Frame。比如我们要初始化一个student的Data Frame其中包含ID和Name还有Gender以及Birthdate,那么代码为:student<-data.frame(ID=c(11,12,13),Name=c("Devin","Edward","Wenli"),Gender=c("M","M","F"),Birthdate=c("1984-12-29","1983-5-6","1986-8-8”))
另外也可以使用read.table() read.csv()读取一个文本文件,返回的也是一个Data Frame对象。读取数据库也是返回Data Frame对象。
%>%是管道符的意思,把左边的输出(不包括 <- 之前的)当成右边的输入。
都可以shift + alt + 上下 :快速复制粘贴
alt + 上下 :移动行
ctrl + alt + 上下 :多重光标
首先选中要注释掉的行,然后按Ctrl+shift+C ,这样就注释掉了。
sessionInfo()
.libPaths()
一篇关于包的博客
library(installr)
updateR()
COS中文论坛 统计之都旗下的论坛网站(d.cosx.org),它和其主站(cosx.org)一 起,是一个致力于推广与应用统计学知识的网站和社区。
1 help("t.test")
2 ?t.test
3 help.search("t.test")
4 apropos("t.test")
5 RGui>Help>Html help
6 查看R包pdf手册
getwd() 显示工作目录
setwd() 设定工作目录
list.files() 列出目录或文件夹下的文件
demo( ) 显示R的基本程序包
example( ) 显示在线帮助的例子
example(barplot)
可以把若干行命令保存在一个文本文件(比如Eg3.R)中,然 后用source函数来运行整个文件: source("E:/R demo/Chapter1-Eg3.R")
sum, mean, var, sd, min, max, range, median, IQR(四分位间距)等为统计量, sort,order,rank与排序有关, 其它还有ave,fivenum,mad,quantile, stem等
-1:1/0 当中/是优先级靠后的操作。相当于c(-1,0,1)/0
names(df) <- c("male", "female", "unknown")
对于矩阵,我们可以使用属性rownames和colnames来访问行名和列名。
我们也可以先定义矩阵x然后再为dimnames(x)赋值:
数值型数据 :1.2345e30
复数常量就用3.5-2.1i
缺失值:NA(Not Available)
是否含有缺失值:
NaN表示不确定的数
• NaN属于NA的一种
• NA不是NaN
注意下面例子的比较 :
assign("x1", c(1, 2))
sort(x)返回x的元素从小到大排序的结果向量。
x=c(2,10,6,8,4,5)sort(x) [1] 2 4 5 6 8 10 order(x)返回使得x从小到大排列的元素下标向量(x[order(x)]等效于sort(x))。
此外numeric(n)可以产生一个长度为n的零向量(numeric(n)是一个 很好用的外部存储器)
paste函数用来把它的自变量连成一个字符串,中间用空格分开
Re( )计算实部,Im( )计算虚部, Mod( ) 计算复数模,Arg( )计算复数幅角。
v为一个向量,取值在-length(x)到-1之间,表示扣除相应 位置的元素。例如:
可以用x[]的写法:
R的对象有两个基本的属性:类型属性(mode)和长度属性(length)。
长度为零的向量 numeric( ) 或者 numeric(0) character( ) 或者 character(0)
数组(array): 带多个下标的类型相同的元素的集合,
函数matrix():用于构造二维数组,即矩阵
函数factor( )用来把一个向量编码成为一个因子。
可以自行指定各离散取值水平(levels),不指定时由x的不同值来求得。
• labels可以用来指定各水平的标签,不指定时用各离散取值的对应字符串。
• exclude参数用来指定要转换为缺失值(NA)的元素值集合。
• ordered取真值时表示因子水平(Levels)是有次序的
因子可以用来作为另外的同长度变量的分类变量,使用tapply() 函数可以完成分类统计
nchar()这个函数简单,统计向量中每个元素的字符个数
tolower()和toupper()可以进行大小写字母的转换
chartr()把字符串里的元素,按要求进行转换
拆分字符串用strsplit()函数,strsplit得到的结果是列表,后面的处理要调用列表
其任何一个语句都可以看成是一个表达式。
表达式之间以分号分隔或用换行分隔。
表达式可以续行,只要前一行不是完整表达式,则下一行为上一行的继续。
线性回归模型:
lm()函数的返回值叫做模型拟合结果对象,本质上是一个列表, 有model 、coefficients、residuals等成员。lm()的结果显示十分 简单,为了获得更多的拟合信息,可以使用对lm类对象有特 殊操作的通用函数,这些函数包括:
add1 coef effects kappa predict residuals alias deviance family labels print summary anova drop1 formula plot proj
加号+或 者减号-,表示在模型中加入一项或去掉一项,第一项前面如果是加号可以 省略
在非交互运行(程序)中应使用print()来输出。
• digits参数指定每个数输出的有效数字位数;
• quote 参数指定字符串输出时是否带两边的撇号;
• print.gap参数指定矩阵或数组输出时列之间的间距
也用来输出,但它可以把多个参数连接起来再输出(具有paste() 的功能)。例如:
读取文件:
strsplit()得到的结果是 列表。
grep() 和 grepl()
sub()和gsub()
但严格地说R语言 没有字符串替换的函数,因为R语言不管什么操作对参数都是传值不传址,区别如下:
用substr()和substring() 可以通过位置进行字符串拆分或提取,两者的参数设置基本相同:
strtrim() 函数可以用于将字符串修剪到特定的显示宽度通过位置进 行字符串拆分或提取:
由于日期内部是用double存储的天数,所以是可以相减的。
weekdays ( )取日期对象所处的周几;
months ( )取日期对象的月份;
quarters ( )取日期对象的季度;
其任何一个语句都可以看成是一个表达式。
表达式之间以分号分隔或用换行分隔。
表达式可以续行,只要前一行不是完整表达式,则下一行为上一行的继续。
quantile(x, probs=seq(0,1,0.25), na.rm=FALSE, names=TRUE, type=7, …)
probs给出相应的百分位数,默认值是0,0.25,0.5,0.75,1;na.rm是处 理缺失数据的,na.rm=TRUE时,NA和NaN将从数据中移走,向量取值中 若有NA或NaN,要添加这一参数,否则会出错;names若为TRUE,返回 值当中有names这个属性"type是取值1-9的整数,选择了九种分位数算法 (具体算法见帮助文件)中的一种。
数据的分布主要考察分布函数(p), 密度函数(d), 分位数函数(q)及产生随机数(r)
以正态分布为例:
hist(x, breaks="Sturges", freq=NULL, probability=!freq,… )
break规定了直方图的组距(必须覆盖数据的范围);freq是逻辑变量,TRUE是频率直方图, FALSE是密度直方图;probability和freq相反,TRUE是密度直方图,FALSE是频率直方图
其形式为 coplot(y ~ x | z),其中x 和y是数值型向量,z是同长度的因子。 对z的每一水平,绘制相应组的x和y的散点图
R缺省的图形边空常常太大,以至于有时图形窗口较小时边空占了整个图形的很大一部分。
R可以在同一页面开若干个按行、列排列的窗格,在每个窗格中可以作一 幅图。每个图有自己的边空,而所有图的外面可以包一个“外边空”。
一页多图用 mfrow 参数或 mfcol 参数规定,如
函数 mtext 用来在外边空加文字标注。其用法为
在多图环境中还可以用 mfg 参数来直接跳到某一个窗格,比如
可以不使用多图环境而直接在页面中的任意位置产生一个窗格来绘图,参数为 fig ,如:
先用as.factor()转化成因子。因为levels()函数里面必须是因子。
dat$Genre没有转化成因子形式,as.factor(dat$Genre)就可以了
该消息表明文件的最后一行不以行尾 (EOL) 字符结尾(换行符 ( \n ) 或回车 + 换行符 ( \r\n ))。此消息的初衷是警告您该文件可能不完整;大多数数据文件都有一个 EOL 字符作为文件中的最后一个字符。
这是因为R读取文件的时候,是一整段character,所以它只会返回1,适当给他分一下段。