高斯核函数RBF

2023-02-27 18:05:02Python015

高斯核函数RBF,第1张

5-11、高斯核函数RBF

import numpy as np

import matplotlib.pyplot as plt

from sklearn import datasets

from matplotlib.colors import ListedColormap

from sklearn.preprocessing import StandardScaler

from sklearn.svm import SVC

from sklearn.pipeline import Pipeline

from sklearn.model_selection import train_test_split

plt.rcParams['font.sans-serif'] = ['SimHei']

plt.rcParams['axes.unicode_minus'] = False

x, y = datasets.make_moons(n_samples=1000, noise=0.25, random_state=2020) # 生成1000个数据样本

plt.figure()

plt.scatter(x[y == 0, 0], x[y == 0, 1], color="r")

plt.scatter(x[y == 1, 0], x[y == 1, 1], color="g")

plt.title('散点图')

plt.show()

x_train, x_test, y_train, y_test = train_test_split(x, y, random_state=2020)

# 绘制边界曲线

def plot_decision_boundary(model, axis):

x0, x1 = np.meshgrid(

np.linspace(axis[0], axis[1], int((axis[1] - axis[0]) * 100)).reshape(-1, 1),

np.linspace(axis[2], axis[3], int((axis[3] - axis[2]) * 100)).reshape(-1, 1)

)

x_new = np.c_[x0.ravel(), x1.ravel()]

y_pre = model.predict(x_new)

zz = y_pre.reshape(x0.shape)

# 设置颜色

cus = ListedColormap(["#BA55D3", "#FF69B4", "#FFE4C4"])

plt.contourf(x0, x1, zz, cmap=cus)

def RBFkernelSVC(gamma):#高斯核函数RBF

return Pipeline([

("std", StandardScaler()),

("svc", SVC(kernel="rbf", gamma=gamma))

])

sv = RBFkernelSVC(gamma=1)

sv.fit(x_train, y_train)

plot_decision_boundary(sv, axis=([-1.8, 2.5, -1.4, 1.8]))

plt.scatter(x[y == 0, 0], x[y == 0, 1], color="r")

plt.scatter(x[y == 1, 0], x[y == 1, 1], color="g")

plt.title('高斯核函数RBF')

plt.show()

# 打印出分数

print(sv.score(x_test, y_test))

d = datasets.load_iris()

x = d.data

y = d.target

x_train, x_test, y_train, y_test = train_test_split(x, y, random_state=2020)

sv = RBFkernelSVC(gamma=10)

sv.fit(x_train, y_train)

# 打印出分数

print(sv.score(x_test, y_test))

在医学的英文简称中：

RBF的意思是——肾血流量；

RPF的意思是——肾血浆流量；

GFP的意思是——绿色荧光蛋白；

肾血流量：肾血流量(renal blood flow，RBF)测定是用清除率试验来进行的。某一物质既从肾小球滤过，又从肾小管大量排出，并且不被重吸收，在它1次流经肾组织之后，便能完全被清除，该物质的清除率就代表单位时间内流经’肾脏的血浆量。

肾血浆流量：肾血浆流流量又称肾血浆流量（renal plasma flow，RPF），它是指单位时间内流经肾脏的血浆量。如果血中某物质既可由肾小球滤过，又可从肾小管排泌，其清除率则为肾小球滤过和肾小管排泌的综合结果。若该物质经过肾脏循环1周以后可完全被清除，该物质的血浆清除率即等于肾脏1min内的血浆流量。

绿色荧光蛋白：绿色荧光蛋白最早是由下村修等人在1962年在一种学名Aequorea victoria的水母中发现。其基因所产生的蛋白质，在蓝色波长范围的光线激发下，会发出绿色荧光。这个发光的过程中还需要冷光蛋白质Aequorin的帮助，且这个冷光蛋白质与钙离子(Ca2+)可产生交互作用。

参考资料

百度：https://www.baidu.com/s?wd=%E7%BB%BF%E8%89%B2%E8%8D%A7%E5%85%89%E8%9B%8B%E7%99%BD&rsv_spt=1&rsv_iqid=0xb3bda233000c513a&issp=1&f=8&rsv_bp=1&rsv_idx=2&ie=utf-8&rqlang=cn&tn=98012088_4_dg&ch=12&rsv_enter=0&rsv_t=115aSLUHomd05c8ctOwjcmqgksVaBxghYTeY%2B%2BQxr0R%2FrF%2F4v8y4plXsvwgQ%2FY5B1eJYpg&oq=%25E8%2582%25BE%25E8%25A1%2580%25E6%25B5%2586%25E6%25B5%2581%25E9%2587%258F&rsv_pq=acc49e67000d67cc&rsv_n=2&rsv_sug3=3&bs=%E8%82%BE%E8%A1%80%E6%B5%86%E6%B5%81%E9%87%8F

1、线性模型~回归分析：【包】：stats 【函数】：lm(formula, data, ...)逐步回归：step(lm(formula, data, ...))回归诊断：influence.measure(lm(formula, data, ...))多重共线性：kappa(XX,exact=T), eigen(XX)自相关检验：一阶：dwtest(y~x) 多阶：bgtest(y~x,order=2,type=”Chisq”)【备注】：1）stats包里的lm()可做多元线形模型，anova.mlm()比较多个多元线形模型，manova()做多元方差分析（MANOVA）。2）sn包的msn.mle()和 and mst.mle()可拟合多元偏正态和偏t分布模型。3）pls包提供偏最小二乘回归（PLSR）和主成分回归；4）ppls包可做惩罚偏最小二乘回归；5）dr包提供降维回归方法，如：片逆回归法(Sliced Inverse Regression)、片平均方差估计(sliced average variance estimation)。6）plsgenomics包做基于偏最小二乘回归的基因组分析。7）relaimpo包可评估回归参数的相对重要性。2、logistic回归：【包】：stats 【函数】：glm(formula, family=gaussian,data, ...)注：familybinomial(link = "logit") gaussian(link = "identity") Gamma(link = "inverse") inverse.gaussian(link = "1/mu^2") poisson(link = "log") quasi(link = "identity", variance = "constant") quasibinomial(link = "logit") quasipoisson(link = "log")

3、无监督分类~决策树：【包】：rpart 【函数】：rpart(formula,data, method="class",control=ct,parms=list(prior=c(p,1-p),split="information"))

rpart.plot(fit,branch=1,branch.type=2,type=1,extra=102,shadow.col=”gray”,box.col=”green”,

split.cex=1.2,main=”Kyphosis决策树”) #提供了复杂度损失修剪的修剪方法

printcp(fit):告诉分裂到哪一层，CP，nsplit，rel，error，交叉验证的估计误差（xerror），标准误差（xstd）

prune(fit,cp=fit$cptable[which.min(fit$cptable[,"xerror"]),"CP"])：剪枝函数

【备注】：1）CRAN的 MachineLearning任务列表有对树方法的细节描述。

2）分类树也常常是重要的多元方法，rpart包正是这样的包，

3）rpart.permutation包还可以做rpart()模型的置换（permutation）检验。

4）TWIX包的树可以外部剪枝。

5）hier.part包分割多元数据集的方差。

6）mvpart包可做多元回归树，

7）party包实现了递归分割（recursive partitioning），