在分类任务中,也可用于画混淆矩阵:
一些参数的含义:
例子:
将最后一行改为,设置最大值和最小值:
设置中心值:
从文件中获取数据,并画图给出有意义的横纵坐标:
将passengers对应的人数标出:
设置方格之间的间隔:
设置使用不同的颜色:
以某个具体的数据为中心:
自动填充坐标值:
不画右边的热度条:
本课将继续介绍 Seaborn 中的统计图。一定要牢记,Seaborn 是对 Matplotlib 的高级封装,它优化了很多古老的做图过程,因此才会看到一个函数解决问题的局面。
在统计学中,研究数据的分布情况,也是一个重要的工作,比如某些数据是否为正态分布——某些机器学习模型很在意数据的分布情况。
在 Matplotlib 中,可以通过绘制直方图将数据的分布情况可视化。在 Seaborn 中,也提供了绘制直方图的函数。
输出结果:
sns.distplot 函数即实现了直方图,还顺带把曲线画出来了——曲线其实代表了 KDE。
除了 sns.distplot 之外,在 Seaborn 中还有另外一个常用的绘制数据分布的函数 sns.kdeplot,它们的使用方法类似。
首先看这样一个示例。
输出结果:
① 的作用是设置所得图示的背景颜色,这样做的目的是让下面的 ② 绘制的图像显示更清晰,如果不设置 ①,在显示的图示中看到的就是白底图像,有的部分看不出来。
② 最终得到的是坐标网格,而且在图中分为三部分,如下图所示。
相对于以往的坐标网格,多出了 B 和 C 两个部分。也就是说,不仅可以在 A 部分绘制某种统计图,在 B 和 C 部分也可以绘制。
继续操作:
输出结果:
语句 ③ 实现了在坐标网格中绘制统计图的效果,jp.plot 方法以两个绘图函数为参数,分别在 A 部分绘制了回归统计图,在 B 和 C 部分绘制了直方图,而且直方图分别表示了对应坐标轴数据的分布,即:
我们把有语句 ② 和 ③ 共同实现的统计图,称为联合统计图。除了用 ② ③ 两句可以绘制这种图之外,还有一个函数也能够“两步并作一步”,具体如下:
输出结果:
前言:生物信息工作中各种热图层出不穷,介绍两种特殊的热图画法1.含有NA数据的热图
数据格式如上图所示
python 中用pandas 处理一下数据
热图用R pheatmap
在使用maftools中有个一个互斥图非常好看,而且在图中表示了一部分F检验的内容
下面就用image画一个类似的图形分别用T检验和Pearson检验来画
原始数据是这样的
用pandas 处理数据
数据两两计算形成一个对称的矩阵
在将重复部分用np.nan填充
使用R image 来画一个