深入浅出介绍聚类分析

2023-02-24 08:48:02Python024

深入浅出介绍聚类分析,第1张

聚类分析是生信分析中常用的工具，在转录组分析中经常用到。聚类分析将表达模式相似的基因聚类在一起，以基因集的形式进行后续分析，今天我给大家介绍其相关原理。

聚类方法有很多，常用的有以下几个：

下图的例子展示的是，差异表达基因集的聚类热图。

多是基于R语言heatmap.2函数绘制（gplots程序包），该函数默认使用的聚类方法是计算欧式距离（Euclidean Distance）进行层次聚类（Hierarchical Cluster）。

这个图的是什么意思呢？我们来解释一下。

首先，我们先明确下什么是欧式距离（Euclidean Distance）：

欧式距离，也称欧几里得距离，是衡量多维空间的两个点之间的绝对距离，

（1）二维平面，两点a(x1,y1)，b(x2,y2) 欧式距离的计算公式为：

（2）三维空间，欧式距离的计算公式为：

（3）n维空间，欧式距离的计算公式为：

那么，体现在基因表达量的矩阵上，则如下：

（1）首行为样本名；

（2）首列为基因名；

（3）数字则为基因在相应样本中的表达量（一般使用标准化后的表达量矩阵）

Gene1与Gene2的欧式距离为：

Gene1与Gene3的欧式距离为：

Gene1与Gene4的欧式距离为：

计算出所有基因两两之间的欧式距离之后，就可以进行聚类啦：

Cluster之间的聚类，则有3种方法：

R语言中hclust函数的默认方法为最长距离法（complete-linkage）。

以上的聚类过程即称之为 层级聚类 。

层级聚类一般伴随着 系统聚类图 ，系统聚类图分支的长短也体现Cluster形成的早晚，分支越短，形成的越早，基因表达模式也越相近。

聚类分析将基因划分为不同的基因集合，用于反映不同实验条件下样品差异表达基因的变化模式。

功能相关的基因在相同条件下通常具有相似的表达模式，例如被共同的转录因子调控的基因，或其产物构成同一个蛋白复合体的基因，或参与相同生物学过程的基因。对这些基因集进行分析往往可以获得比单基因分析更为可靠的结果。

背景：了解机器学习算法原理时，其中KNN分类算法中提及的欧式距离。

解释：欧式距离又叫欧几里德度量。用于定义多维空间的距离。

理解：

1、首先定义在n维空间两个点X,Y的坐标分别为（）和（）：

如一维中，和

二维中，和

以此类推……

n维中，和

2、由此计算两个点的欧式距离。

二维中，两点距离为：

n维中，两点距离为：

基因距离欧式多维的是

# 上一篇：用Python 做毕业设计选什么项目比较好?

# 下一篇：amd显卡上的那个女的！！红头发的那个！！是谁或者以谁为原型！！！？？？详细点

给您推荐相同类型的内容：

golang del调试怎么加大内存
应该是内存的问题，你可以在资源管理其中删除几个不重要的而且占内存的进程，若还不行就试着增加一些虚拟内存增加虚拟内存的方法：我的电脑-属性-高级-设置（第一项S）-高级-更改（最下面）。到这里就可以设置了，系统默认为C盘（系统盘）自定义，
R语言绘制好看的饼图、空心饼图
饼图或者说扇形图在统计分析结果展示中非常常用，R语言自带做饼图的函数pie，做起来非常简单，只需提供比例，样品名称即可。默认的颜色只有6中，循环使用的，不过这个颜色可以自定义。用pie作图其实就够了，但奈何很“卷”，有其他好看的
Ruby的发展前景怎么样？
Ruby是一种简单的面向对象编程语言，十分容易上手，并且功能强大。她是一个日本的Yukihiro Matsumoto（大家都叫他Matz.）在1995年首次发布的。Ruby从Perl语言那里借鉴了许多东西（有人开玩笑说Ruby是Perl
红警有没有手机版？
1，安卓平台上没有，红色警戒主要是电脑版，智能手机上是没有的。2，红色警戒有一个塞班版，功能手机版(键盘机) 塞班版的单位建筑和原版一样3，安卓上有一个5m的红警大战，不是红警，很像红警，但是有内置插件。拓展资料：
go语言应用程序内存错误，高分悬赏
应用程序发生异常未知的软件异常1.病毒木马造成的，在当今互联网时代，病毒坐着为了获得更多的牟利，常用病毒绑架应用程序和系统文件，然后某些安全杀毒软件把被病毒木马感染的应用程序和系统文件当病毒杀了导致的。2.应用程序组件丢失，应用程序完整的
用 C语言编写程序（小偷问题）【是C语言】
#include &ltstdio.h&gtint main() { int a,b,c,dif( !(a=0)&amp&amp(c=1)&amp&amp(d=1)&amp&a
广东海洋大学计算机二级c语言难吗
广东海洋大学计算机二级c语言一般来说不是很难，只要学过相关课程的一般都能通过。二级C难度不大，相比来说来说容易的。因为C语言是最基础的计算机语言，VB、C++基本是C语言的延伸如果有C语言基础，学其他语言就不会很吃力，而且二级C语言考试难点
什么时候中国大学开始c语言教学的?
1991年，清华大学开设中国第一个C语言课程。C语言二十世纪80年代流行，1989年出现第一个标准，即C89.1991年，清华大学第一个开始C语言教程，使用教材为谭浩强编写的《C语言程序设计》第一版(1991)，由清华大学出版社出版。199
windows 怎么编译 go语言
1、解压压缩包到go工作目录，如解压到E:opensourcegogo，解压后的目录结构如下： E:opensourcegogo├─api├─bin│├─go.exe│├─godoc.exe│└─
c语言菜鸟求指教
printf("please input r n")scanf("%f",&ampr)printf("please input h n")scanf("
go语言怎么修改字符串中的某一个字符？
go语言的字符串是UTF-8编码的、不可改变的字节序列。要修改字符串，只能以原串为基础，创建一个新串。下面的图中是一个参考示例，提供了以原串为蓝本，创建新串的两种方法。代码输出golang原生数据类型：按长度：int8(-128-127)
go语言json处理
json是一种经常使用的数据格式，下面总结一下json的使用 json与struct转换的话struct的属性必须首字母大写。当用的多了就会发现一个致命的问题：go默认会将特殊字符转义采用以下方法可以解决：处理方法1 处
1.从0实现Online Judge（go语言）-整体介绍
这个 online judge 是我的毕业设计，采用 go 语言，结合 docker 等技术实现，主要是为了学习相关的技术，系统还有很多问题（尤其是安全方向），仅是为了学习而已。使用的开源项目Nsq，用于各个组件相互通信。主要是
WAS 中JAVA内存溢出的问题应该按照什么思路来解决？
�故荖ative thread无法创建，前者用MaxPermSize调整（IBM JDK没这个参数），后者调小最大堆大小或者Xss调整每个线程分配内存的大小。如果是常见的堆的溢出，确保OutOfMemory时能生成heapdump文件，用D
如何在ruby中用http 发送get，post请求
require 'nethttpclient'client = Net::HTTPClient.newhost="www.youraddress.com"postdata="subject
Rails内存优化
我们知道Rails应用的内存占用通常都是比较高的，尤其是比较重型的全栈应用内存使用更接近1G（当然同时也包括想sidekiq这样加载整个Rails应用的ruby进程），所以我们通常对应这种情况都采取一种比较tricky的方式，使用像 pu
R语言里的 function(size=10, rep=1000)什么意思，function()具体怎么用？
function用来定义函数，一般一个函数放在一个.m文件里。举个简单的例子建立一个myfunction.m，然后在文件中写。function y=myfunction(a,b)其中a,b是输入函数的参数，y是函数返回的值。当需要返回多个值
为什么我选择了Ruby而不是Python
伴随着RoR的风行，Ruby语言受到越来越多的开发者的关注，同为脚本语言，Python的地位却略显尴尬，什么样的原因，造成了这样的局面？笔者认为有以下几个方面：一、 RoR的推波助澜笔者认为，Ruby的成功，很大一部分是由于RoR的带
关于学生综合成绩计算的编程
希望对你有所帮助，错误我都改过了。*编制一个学生成绩管理系统，每个学生信息包括：学号、姓名、C语言、高数和英语成绩。具体功能：（1）创建信息链表并以磁盘文件保存；（2）读取磁盘文件并显示输出所有学生的成绩；（3）按学号或姓名查询成绩；（4
广州java开发就业形势如何?广州java开发就业薪资有多少?
广州javaee工程师就业形势分析：招聘待遇，工资6000-7999占比最多，经验要求，0-2年工作经验要求的占比最多，学历要求，大专学历要求的占比最多，广州java实习程序员平均工资￥3910元月，广州Java高级程序员平均工资￥118
当遇到老版本的java代码与新代码不一样时怎么办
1.验证错误有一种情况非常匪夷所思：即使你确定Java安装正确，但仍然会报错!如果出现这种情况，你可以通过验证Java是否可以正常工作来排除这个错误，点击这个页面，就可以进行验证。如果可以正常工作，那就说明没有问题。2.与旧版本冲突如果Ja
ruby 1.9.2 array to_json 中文乱码
没有遇到过类似情况，你试一下$kcode = utf8这几个字转化正确：轻: u8f7b身: u8eab药: u836f剂: u5242代码阶段(1)导入jsonrequire 'json'(2)创建个json串myJs
如何用r语言绘制多变量散点图
给你一些代码，你慢慢研究：install.packages('ggplot2')library(ggplot2)ggplot(a)+geom_bar(aes(x1,y,fillcol=x1x2),position=&
6 个值得玩味的 Python 代码
先选取了 6 个自己认为值得玩味的 python代码，希望对正在学习 python 的你有所帮助。1、类有两个方法，一个是 new,一个是 init,有什么区别，哪个会先执行呢？运行结果如下：再来看另一
Python处理大数据的技巧, 2022-06-21
(2022.06.21 Tues) 收集整理了Python处理大量数据的方法，基于Pandas，Numpy等数据处理工具。用df的 info 方法并指定 memory_usage='deep' 参数，或使用df
如何在Mac 终端升级ruby版本
rvm是什么？为什么要安装rvm呢，因为rvm可以让你拥有多个版本的Ruby，并且可以在多个版本之间自由切换。第一步：安装rvm$ curl -L get.rvm.io | bash -s stable$ source ~.rvmscr
C语言 s[i].ag+j意思
s[i]是一个数组，你也可以看着是一个指针。s[i].ag就是s[i]这个指针所指向的一个成员变量。楼主这个程序应该有结构体或者类吧。。比如我们定义一个结构struct student{int agint mun}s如果我们要使用ag和mu
黑马程序员怎么样
黑马程序员为行业“学员质量好、课程内容深、企业满意”的移动开发高端训练基地，并被评为中关村软件园重点扶持人才企业。1、2010年，黑马程序员在中关村软件园开设第一个Android培训学科，现已开设JavaEE、PHP+H5全栈工程师、产品
java中的queue类有哪些用法？
java中的queue类是队列数据结构管理类。在它里边的元素可以按照添加它们的相同顺序被移除。队列通常（但并非一定）以 FIFO（先进先出）的方式排序各个元素。不过优先级队列和 LIFO 队列（或堆栈）例外，前者根据提供的比较器或元素的自然
amd显卡上的那个女的！！红头发的那个！！是谁或者以谁为原型！！！？？？详细点
AMD是火红色，短发、紧身衣的Ruby MM曾是AMD显卡的代言人，只不过这几代的显卡上Ruby妹子出镜率低多了，以往用的最多的蓝宝石都把代言妹子变成迷彩涂装了。这就是经典的短发Ruby妹子，不过很快就会长出长发了GDC 2013大会上，A

推荐阅读

热门文章

最新发布

标签列表

深入浅出介绍聚类分析

给您推荐相同类型的内容：