R语言-KNN算法1、K最近邻(k-NearestNeighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本2023-02-18Python170
R语言中的循环语句$curl = curl_init()curl_setopt($curl,CURLOPT_URL,$_GET['url'])curl_setopt($curl,CURLOPT_RETURNTRANSFER,true)cu2023-02-18Python160
《R语言实战》自学笔记69-重抽样和自助法数据准备 许多实际情况中统计假设(假定观测数据抽样自正态分布或者其他性质较好的理论分布)并不一定满足,比如数据抽样于未知或混合分布、样本量过小、存在离群点、基于理论分布设计合适的统计检验过于复杂且数学上难以处理等情况,这时基于随机化和2023-02-18Python180
R语言中 all.equal(sqrt(2)^2,2)表示什么?【MATLAB】用surf函数画出来的图 叫surf 三维着色表面图、三维表面图、表面图。比如:xi=-10:0.5:10yi=-10:0.5:10[x,y]=meshgrid(xi,yi)z=sin(sqrt(x.^2+y.^2)2023-02-18Python640
R语言学习之决策树R语言学习之决策树决策树最重要的2个问题:决策树的生长问题,决策树的剪枝问题。生长问题又包括了2个子问题:从分组变量的众多取值中选择一个最佳分割点和从众多输入变量中选择当前最佳分组变量;剪枝问题包括2个子问题:预修剪(事先指定树的最大深度,2023-02-18Python260
R语言-17决策树是一个预测模型,分为回归决策树和分类决策树,根据已知样本训练出一个树模型,从而根据该模型对新样本因变量进行预测,得到预测值或预测的分类 从根节点到叶节点的一条路径就对应着一条规则.整棵决策树就对应着一组表达式规则。叶节点就代表该规则下2023-02-18Python120
python之KS曲线# 自定义绘制ks曲线的函数 def plot_ks(y_test, y_score, positive_flag): # 对y_test,y_score重新设置索引 y_test.index = np.aran2023-02-18Python90
学R记3:数据可视化-ggplot2R has several systems for making graphs, butggplot2 is one of the most elegant and most versatile. ggplot2 implements2023-02-18Python1830
R语言ggtree画圆形的树状图展示聚类分析的结果那么圆形的树状图如何实现呢?我查找了一下相关资料。 R语言包 dendextend 这个包可以实现,利用 help(package="dendextend") 查看帮助文档,能够看到其中的一个小例子 但是这个后期2023-02-18Python250
(Python)numpy 常用操作不放回取样: 从列表ori中不放回地取n个数 通过这种操作,我们可以获得一个二维列表的子集: (如果这个二维列表是图的邻接矩阵,那么就是对图进行随机采样,获得一个图的子图) 首先要注意,"+" 操作对于l2023-02-18Python160
r语言amore包实现的是什么神经网络#载入程序和数据 library(RSNNS) data(iris)#将数据顺序打乱 iris <- iris[sample(1:nrow(iris),length(1:nrow(iris))),1:ncol(iris)]#定义2023-02-18Python100
prior什么意思中文prior的意思:先验概率(天主教小隐修院的)修道长,院长(天主教大隐修院的)修道长,副住持最高行政长官。双语例句:1. Prior to the 19th century, there were almost no channels o2023-02-18Python170
R语言怎么检验分布是不是T分布ks.test()实现了KS检验,可以检验任意样本是不是来自给定的连续分布。你这里的用法就是:ks.test(data,pt,df=df) #data是样本的数据,df是要检验的t分布的自由度我们可以用很多方法分析一个单变量数据集的分布。最2023-02-17Python320
【R语言编程】---绘制带聚类树的丰度图(代码示例)前言:接上一篇,很多文献中为了更直观的展示一个微环境中的菌群分布,常常将样本聚类与物种丰度同时展示。 1.数据结构 首先需要准备丰度数据表Abundance.txt和分组信息group.txt 丰度数据以样本为列名,以菌种为行名2023-02-17Python350
R语言入门--第十一节(置换检验与自助法求置信区间)原理参考 文章 ,主要思想我认为是求出所有分布的可能(中间的一般为零假设),出现这种分布的概率。distribution= 参数可为exact(精确模式,即依据所有可能的排列组合,仅适用于两样本问题)、approxiamate(nr2023-02-17Python120
机器学习中计算Precision时出现0除以0怎么办?1.如果真的发生了这种情况,precision=00,直接无意义,直接划去;2.训练集测试集通过不同的采样方式(直接73开、bootstraping等方法),理论上基本不可能出现这种极端情况。除非整个数据集里正样本数量远远小于负样本,那你2023-02-17Python270
r语言中的var函数是什么意思c语言中函数var是什么意思?函数var假定其参数是样本总体中的样本。如果数据是样本总体,则应使用VarP函数计算方差。意义:根据给定的样本计算方差。语法:VAR(Number1,number2,…)Number1,number2,。。。是2023-02-17Python180
r语言中的var函数是什么意思c语言中函数var是什么意思?函数var假定其参数是样本总体中的样本。如果数据是样本总体,则应使用VarP函数计算方差。意义:根据给定的样本计算方差。语法:VAR(Number1,number2,…)Number1,number2,。。。是2023-02-16Python1390
Python数据分析(4)决策树模型时间:20210630 系统环境:Windows 10 所用工具:Jupyter NotebookPython 3.0 涉及的库:pandastrain_test_splitDecisionTreeClassifie2023-02-16Python170
如何在R语言中进行神经网络模型的建立不能发链接,所以我复制过来了。#载入程序和数据 library(RSNNS) data(iris)#将数据顺序打乱 iris <- iris[sample(1:nrow(iris),length(1:nrow(iris))),12023-02-16Python140