R的知识迭代之基础操作

Python034

R的知识迭代之基础操作,第1张

这其中有一些是我之前没有学习到的,第一次get感觉超级有用

R运行都是靠对象,所有的对象都有两个内在属性: 类型和长度

类型 包括四种:数值型、字符型、复数型、逻辑型(T/F/NA),用函数 mode() 查看。另外不管什么类型的数据,缺失值都是用NA(Not Available)表示,不是数值用 NaN (Not a Number)表示;

长度 是对象中元素的数目,用 length() 查看

只有数据框和列表支持多种对象并存;因子只有两种类型

向量是一个变量的取值;因子是一个分类变量;数组是一个k维的数据表;矩阵是数组的特例【数组或者矩阵的所有元素都是一种】;数据框是一个或几个向量/因子构成,并且它们必须等长,可以是不同的类型;列表可以包含任何类型的对象(也可以列表包含列表)

利用 ls() 可以查看当前在内存中的对象,但是这个函数只列出了对象名,并且是所有的;

想要查看名称中含有某个指定字符(如x)的对象,可以指定pattern: ls(pat = "x")

想要看以某个字母开头的对象,可以利用 ls(pat = "^x")

如果想看所有对象的详细信息呢? ls.str()

注意引号在输入时应该写作: \" ; paste() 可以连接多个参数成为字符串,其中如果有数值,那么数值会被强制转为字符串;默认空格分割各个字符,使用 sep= 自定义

TRUE、FALSE可以简写成T、F;如果转换为数值,FALSE为0,TRUE为1

利用 factor() 建立

levels 指定因子水平(缺省值是向量x中不同的值);

labels 指定水平名称;

ordered 是逻辑型选项,表示因子水平是否有顺序

这里简单说下根据逻辑值提取

相比于数组,矩阵使用频率更高,构建矩阵使用 matrix

矩阵的排列是有方向性的,规定矩阵 按列 排列,一般不说明的时候,统计函数也是按列计算(但是可以用MARGIN来改变,等于1代表列,等于2代表行)

cov() 与 cor() 分别计算矩阵的协方差矩阵和相关系数阵;

可以进行标准化 scale(x, center=T, scale=T) ;

按列求均值 apply(x, MARGIN=2, FUN=mean)

虽然说数据框与矩阵很相似,也是二维表格,也是要求各个变量的观测值长度相等,但是,在 数据框中,行和列的意义是不一样的 , 其中列表示变量,行为观测

一般用 write.table() 或者 save()

R内置的基本数据集有100多个(常为数据框和列表)。它们随R的启动全部一次性自动载入,通过命令 data() 可以查看全部的数据集(也包含了通过 library() 加载的包中数据集);使用 data(package = "pkname") 可以列出包 pkname 中的所有数据集,但是可能还未被加载,确定要用的时候可以加载包

涉及多个数据集的分析时,最常使用 load("/path/")

最近在使用Pycharm,在运行或者安装的过程中出现了各种各样的报错,前面已经介绍过安装pygame出现报错的解决方法。文章总结了大部分可能会出现的报错,包含原因以及解决方法。

(一)Pycharm报错:No R interpreter defined

No R interpreter defined: Many R related features like completion, code checking and help won’t be available. You can set an interpreter under Preferences->Languages->R

解决方法:

①方法1:下载安装R,然后将R的路径添加到Pycharm中,(R语言官网https://mirrors.tuna.tsinghua.edu.cn/CRAN/),安装好后将R的安装路径添加到pycharm中:

Files->Settings->Plugins->Languages &Frameworks->R Language

②方法2:如无需R语言,直接卸载R语言插件:

Files->Settings->Plugins->R Language Support->Uninstall

(二)找不到指定的模板:ImportError:DDL load failed while importing ft2font:

解决办法:

File->settings->Project: 你的项目名 ->Python Interpreter

在右侧找到matplotlib双击

然后选择版本3.3.1,Install

Python 导入pyecharts模块绘图时报错: “所有图表类型将在 v1.9.0 版本开始强制使用 ChartItem 进行数据项配置 ”的解决方法操作如上,将pyecharts版本更改为1.7.0即可

(三)pycharm中无法识别导入自己写的模块

有时候在同级目录下自己写的函数模块,却不能在同级目录下另一个文件中导入

解决办法:

(1)打开"file"->Settings打开 Console下的Python Console,把选项(Add source roots to PYTHONPAT)点击勾选上

(2)右键点击自己的工作空间(文件/文件夹),点击“Mark Directory as",选择 Sources Root

还有一种情况是,自己写的函数所在的文件夹中没有初始化函数,即__init__.py,在文件夹中创建一个—个__init__.py即可,内容可以啥也不写。

(四)pycharm光标变粗,无法编辑代码

光标变黑块是因为输入方式变成了改写方式,INSERT可以切换 插入/改写模式

解决办法:按一下键盘上的insert键。不同型号的insert键所在位置可能不一样,我的是联想小新14寸,insert键在键盘的右下侧,与PgDn在一个键上,使用insert需要按Fn+Insert

(五)使用Pycharm给Python程序传递参数

程序运行时,如果需要输入参数,如下图中程序代码:

此时输入参数需要在命令行中运行:python 文件名.py 参数1 参数2

如果直接在Pycharm环境中简单执行“Run”菜单下的“Run”命令,会出现错误,提示需要输入参数。

为了能够直接在Pycharm中运行,可以使用一下方式设置参数:

Run->Edit Configurations->选择需要设置参数的.py文件->Parameters

设置好后点击OK即可完成。这下运行就不会报错啦!

pycharm 导入项目报错no python interpreter configured for the project

找到设置 project interpreter ,添加pythonw.exe 解释器即可

PAT考试,全称为Physics Aptitude Test,是牛津大学考试中心与英国入学考试服务中心合作开设的物理能力测试。如果想要申请牛津大学Physics, Physics and Philosophy, Engineering Science, Materials Science等相关专业的学生必须提交PAT成绩。

由于PAT是开放性考试,所以即使不报考牛津大学上述专业,学生也可以选择参加考试,优秀的PAT成绩有助于提高学生在申请牛津大学或其它英国高校物理、物理与哲学、工程与材料系时的学术竞争力。

如果想要申请牛津大学 Physics,Physics and Philosophy,Engineering Science,与Materials Science相关专业的学生必须提交PAT成绩。

考试日期:

2020年11月4日

考试时间:

PAT考试时长2小时,数学、物理两部分,每部分50分,共100分。

第1部分:物理相关数学 (Part A: Mathematics for Physics)共10小题,每小题5分(无选择题);

第2部分:物理(Part B: Physics)共10小题,每小题5分(无选择题)。

考试大纲:

基础数学:

· 将假定您具备基本数学知识,尤其是算术,包括坐标几何在内的几何以及概率的主题。问题可能需要在物理环境中操纵数学表达式。

代数:

· 了解多项式的性质,包括使用公式或因式分解的二次方程式。

· 图形草图绘制,包括使用微分查找固定点。

· 变量的转换。

· 解决不平等问题。

· 基本三角学,包括正弦,余弦和切线之间的关系(如果需要,将说明总和和差公式)。

· 对数和指数的属性,以及如何组合对数,例如log(a)+ log(b)= log(ab)。

· 掌握n个(或无限个)项的算术和几何级数之和的公式的知识。

· 对仅使用n的正整数值的(a + bx)n等表达式使用二项式展开式。

微积分:

· 多项式的微分和积分,包括分数幂和负幂。

· 微分找到一条曲线的斜率,以及最大值和最小值的位置。

· 积分是微分的逆向,是曲线下面积的发现。

· 通过对称参数简化积分,包括使用偶数和奇数函数的属性(其中偶数函数具有f(x)= f(-x),奇数函数具有f(-x)=-f(x))。

考试试卷展示:

考而思还有PAT相关辅导课程,可以帮助大家提升答题技巧。顺利通过考试!