上图是一个简单的例子,b为一矩阵,现在想统计第二列中数值等于1的元素个数,首先做一个逻辑判断,即b[,2]==1,得到一个由布尔变量true和false组成的向量。
此时只需要知道true的数量,由于对布尔变量求和,true转化为1,false转化为0,故对该向量求和即可得到true的数量,即b[,2]中等于1的数量。
安装和启动比spss快很多。上课时,老师:“先不下R studio了,这个初学够用。”
哈哈哈哈哈好的。
程序可以不难学,反正我不太喜欢上来就搞最难的,零基础小白菜得安详。
哎呀,这个课老师真的超可爱,先介绍了“R当计算器比电脑自带的好用多了!”,安利了一波计算器使用方法,像极了分享自己宝贝玩具的大男孩。
R当做计算器也的确简单。把脑子里想的数学公式打进去按回车就行了。
数学函数表示方式可能得查一下。百度必应谷歌,一搜解千愁。
常见:pi --π ;sqrt(2)=根号2;log()=ln();exp()=e^x.
说起来这些对我来说也不常用,用不到的知识又增加了
好了,
1、基础概念之向量,Vectors:【向量是一串有序数据,向量内】
R里vectors分三种,数值、逻辑值、字符串,英文分别是
Numeric vectors
Logical vectors
Character vectors。
mode(x)语句可查看哪一类。
R里的向量表示方式:
输入数值可直接 c(1,2),字符串需要加单/双引号:c('hi',"morning")
逻辑值按回车后可判断正误,true false,或者NA(not available)。
2、变量、变量名、赋值
变量,咋说呢,定义是“A variable is used to store information”,反正就指代某一大串信息。
接下来,给变量起名字,并赋值。起名字有讲究的。
对了,打字之前,先知道一句R对大小写敏感(大小写敏感是说,大写小写在R看来是不同的东西,Yes 不等于 yes ),请把这句话记好。
起名字的规矩其实就三条:
1、可以有√:A-Z, a-z, 0-9, 英文句号 (.) 下划线 (_)
2、不能有×:空格,reserved keywords
3、开头只能是字母或点
(保留字是啥之后再说叭,今天用不到)
好了,现在已经会起名字了。再也不怕变量太多分不清了
那开始把名字和数据配配对。
赋值符号 :"
x=2, x
在R看来一个意思。
那怎么告诉它我想要的是“x小于负二”?
加空格。x<-2
是不是很妙
资料:《Statistical Analysis of Network Data with R》
语言R常见的网络分析包:
网络分析研究大部分是描述性的工作。
网络的可视化 即是一门艺术,也是一门科学。
三元闭包体现了社会网络的“传递性”(transitivity),枚举所有节点三元组中构成三角形的比值来表征。
网络的可视化和数值特征化是网络分析的首要步骤之一。
网络可视化视图将数据的多个重要反面整合在一个图表中。
该节点在多大程度上会与同类型或者不同类型的其他节点进行匹配,可以通过一种相关性统计量(所谓的同配系数)进行量化。
将复杂系统中感兴趣的问题与合适的网络概括性度量匹配起来,是网络特征化方法起作用的关键所在。
网络中的频繁子图模式
网络聚类系数的分布,用来检验社会网路的聚集性上
sand安装包
网络数据统计分析 statistical analysis of network data
在CRAN上
G=(V,E)
节点 :vertices 或者 nodes
边:edges 或者 links
节点数量:图的阶数 order
边的数量:图的规模 size
同构图 isomorphic
无向 undirected
有向 directed graph 或者 digraph
边:有向边 directed edges 或 弧 arcs
双向 mutual
小的图形用 formulate来创建
把mg转化为wg2
Zachary 空手道俱乐部网络 (karate club network)
数据集合实际上只存在两个社团,分别以教练为中心和以主管为中心。
Lazega律师网络可视化
srt() 不能用使用 upgrade_graph()d代替
DrL算法,针对大型网络可视化设计的布局算法。
节点的节点,即社区节点(主题节点)
即一个中心节点,一其直接相连的邻居,以及这些节点至今的边。
度值不同的节点以何种方式彼此连接
图的密度
全局聚类系数
局部聚类系数
互惠性 reciprocity
二元组普查