python画热力图

Python014

python画热力图,第1张

python中可使用seaborn.heatmap画热力图, 官方文档在这

在分类任务中,也可用于画混淆矩阵:

一些参数的含义:

例子:

将最后一行改为,设置最大值和最小值:

设置中心值:

从文件中获取数据,并画图给出有意义的横纵坐标:

将passengers对应的人数标出:

设置方格之间的间隔:

设置使用不同的颜色:

以某个具体的数据为中心:

自动填充坐标值:

不画右边的热度条:

本课将继续介绍 Seaborn 中的统计图。一定要牢记,Seaborn 是对 Matplotlib 的高级封装,它优化了很多古老的做图过程,因此才会看到一个函数解决问题的局面。

在统计学中,研究数据的分布情况,也是一个重要的工作,比如某些数据是否为正态分布——某些机器学习模型很在意数据的分布情况。

在 Matplotlib 中,可以通过绘制直方图将数据的分布情况可视化。在 Seaborn 中,也提供了绘制直方图的函数。

输出结果:

sns.distplot 函数即实现了直方图,还顺带把曲线画出来了——曲线其实代表了 KDE。

除了 sns.distplot 之外,在 Seaborn 中还有另外一个常用的绘制数据分布的函数 sns.kdeplot,它们的使用方法类似。

首先看这样一个示例。

输出结果:

① 的作用是设置所得图示的背景颜色,这样做的目的是让下面的 ② 绘制的图像显示更清晰,如果不设置 ①,在显示的图示中看到的就是白底图像,有的部分看不出来。

② 最终得到的是坐标网格,而且在图中分为三部分,如下图所示。

相对于以往的坐标网格,多出了 B 和 C 两个部分。也就是说,不仅可以在 A 部分绘制某种统计图,在 B 和 C 部分也可以绘制。

继续操作:

输出结果:

语句 ③ 实现了在坐标网格中绘制统计图的效果,jp.plot 方法以两个绘图函数为参数,分别在 A 部分绘制了回归统计图,在 B 和 C 部分绘制了直方图,而且直方图分别表示了对应坐标轴数据的分布,即:

我们把有语句 ② 和 ③ 共同实现的统计图,称为联合统计图。除了用 ② ③ 两句可以绘制这种图之外,还有一个函数也能够“两步并作一步”,具体如下:

输出结果:

前言:生物信息工作中各种热图层出不穷,介绍两种特殊的热图画法

1.含有NA数据的热图

数据格式如上图所示

python 中用pandas 处理一下数据

热图用R pheatmap

在使用maftools中有个一个互斥图非常好看,而且在图中表示了一部分F检验的内容

下面就用image画一个类似的图形分别用T检验和Pearson检验来画

原始数据是这样的

用pandas 处理数据

数据两两计算形成一个对称的矩阵

在将重复部分用np.nan填充

使用R image 来画一个