R语言-KNN算法

R语言-KNN算法

1、K最近邻(k-NearestNeighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本
Python170
《R语言实战》自学笔记69-重抽样和自助法

《R语言实战》自学笔记69-重抽样和自助法

数据准备 许多实际情况中统计假设(假定观测数据抽样自正态分布或者其他性质较好的理论分布)并不一定满足,比如数据抽样于未知或混合分布、样本量过小、存在离群点、基于理论分布设计合适的统计检验过于复杂且数学上难以处理等情况,这时基于随机化和
Python180
R语言学习之决策树

R语言学习之决策树

R语言学习之决策树决策树最重要的2个问题:决策树的生长问题,决策树的剪枝问题。生长问题又包括了2个子问题:从分组变量的众多取值中选择一个最佳分割点和从众多输入变量中选择当前最佳分组变量;剪枝问题包括2个子问题:预修剪(事先指定树的最大深度,
Python260
R语言-17决策树

R语言-17决策树

是一个预测模型,分为回归决策树和分类决策树,根据已知样本训练出一个树模型,从而根据该模型对新样本因变量进行预测,得到预测值或预测的分类 从根节点到叶节点的一条路径就对应着一条规则.整棵决策树就对应着一组表达式规则。叶节点就代表该规则下
Python120
python之KS曲线

python之KS曲线

# 自定义绘制ks曲线的函数 def plot_ks(y_test, y_score, positive_flag):     # 对y_test,y_score重新设置索引     y_test.index = np.aran
Python90
(Python)numpy 常用操作

(Python)numpy 常用操作

不放回取样: 从列表ori中不放回地取n个数 通过这种操作,我们可以获得一个二维列表的子集: (如果这个二维列表是图的邻接矩阵,那么就是对图进行随机采样,获得一个图的子图) 首先要注意,"+" 操作对于l
Python160
prior什么意思中文

prior什么意思中文

prior的意思:先验概率(天主教小隐修院的)修道长,院长(天主教大隐修院的)修道长,副住持最高行政长官。双语例句:1. Prior to the 19th century, there were almost no channels o
Python170
R语言怎么检验分布是不是T分布

R语言怎么检验分布是不是T分布

ks.test()实现了KS检验,可以检验任意样本是不是来自给定的连续分布。你这里的用法就是:ks.test(data,pt,df=df) #data是样本的数据,df是要检验的t分布的自由度我们可以用很多方法分析一个单变量数据集的分布。最
Python320
机器学习中计算Precision时出现0除以0怎么办?

机器学习中计算Precision时出现0除以0怎么办?

1.如果真的发生了这种情况,precision=00,直接无意义,直接划去;2.训练集测试集通过不同的采样方式(直接73开、bootstraping等方法),理论上基本不可能出现这种极端情况。除非整个数据集里正样本数量远远小于负样本,那你
Python270
r语言中的var函数是什么意思

r语言中的var函数是什么意思

c语言中函数var是什么意思?函数var假定其参数是样本总体中的样本。如果数据是样本总体,则应使用VarP函数计算方差。意义:根据给定的样本计算方差。语法:VAR(Number1,number2,…)Number1,number2,。。。是
Python180
r语言中的var函数是什么意思

r语言中的var函数是什么意思

c语言中函数var是什么意思?函数var假定其参数是样本总体中的样本。如果数据是样本总体,则应使用VarP函数计算方差。意义:根据给定的样本计算方差。语法:VAR(Number1,number2,…)Number1,number2,。。。是
Python1390