【R>>tSNE】tSNE高效降维

2023-02-25 12:29:01Python017

【R>>tSNE】tSNE高效降维,第1张

t-SNE：T-Distribution Stochastic Neighbour Embedding, T分布随机近邻嵌入。与PCA一样是常用的降维方法，其主要优势在于能保持局部结构的能力，即高维数据空间中距离相近的点投影到低维空间中仍然相近。

R语言中实现的包：Rtsne

来学习下核心函数 Rtsne() 的主要参数：

下面以常规模型构建过程中产生的risk和riskScore数据为例：

下面结合ggplot2进行绘图：

另一种降维方法：PCA，已在之前的笔记中写过。【R>>PCA】主成分分析

参考链接：

t-SNE一种高效的降维算法

作为零计算机基础，纯生物背景的实验喵，有很多技能还不会，只希望将自己学习到的知识记录下来，一方面让自己能够时常温故知新，一方面与大家分享学习内容和心得，一起进步呀。

主成分分析（principle component analysis，PCA）是常用的线性数据降维方法，通过某种线性投影，将高维的数据映射到低维的空间中，并期望在映射到的低维空间中包含的信息量最大，即使用较少的数据维度来代表（保留）较多原始数据的特性。话句话说，就是把多个变量化成少数几个主成分的方法，这些主成分能够反映原始变量的大部分信息，为原始变量的线性组合。

R中作为主成分分析最主要的函数是 princomp() 函数

princomp() 主成分分析可以从相关阵或者从协方差阵做主成分分析

summary() 提取主成分信息

loadings() 显示主成分分析或因子分析中载荷的内容

predict() 预测主成分的值

screeplot() 画出主成分的碎石图

plot() 画出数据关于主成分的散点图和原坐标在主成分下的方向

##设置工作路径

setwd("E:/R practice result")

##查看工作路径

getwd()

##读取数据