最新发布

# 2023-02-09
鸿蒙系统的缩小屏幕功能
鸿蒙系统的缩小屏幕功能说明如下：首先在屏幕的左侧、右侧滑动并长按打开侧边栏；在侧边栏选择需要分屏的应用，可上下滑动选择应用，可以点击最下方的按钮查看更多应用。选择应用后，将会在屏幕上直接以小窗口的形式显示；可按住上方的横条进行拖动，也可
# 2023-02-09
HarmonyOs 网络安全配置，允许应用使用明文流量传输
"deviceConfig": { "default": { "process": "xxx", "directLaunch":
# 2023-02-09
华为首款三分频智能音箱，HarmonyOS家族的颜值与音质担当
HUAWEI Sound X系列从2019年正式推出之后，便备受用户好评。第一代HUAWEI Sound X与帝瓦雷联合设计，在智能音箱当时大多处于功能性的大环境下，第一代HUAWEI Sound X让用户体验到了智慧与音质并
# 2023-02-09
harmonyos是什么意思
harmonyos即鸿蒙系统的意思，正确写法为harmony os。harmony os鸿蒙系统是华为公司在2019年8月9日于东莞举行华为开发者大会（HDC.2019）上正式发布的操作系统。鸿蒙系统面向全场景的分布式操作，将人、设备、
# 2023-02-09
harmonyos忘记密码如何解锁？
如果您确认遗忘自己的手机密码需要解锁，我们可以帮助您将手机强制恢复出厂设置。但是手机中的数据也会被清除，且无法恢复，建议您再回忆一下是否通过云备份或其他方式备份过手机数据。也建议您再仔细回忆一下是否自己设置修改了密码，如果确定无法回忆起密
# 2023-02-09
鸿蒙OS2.0九大新功能，详细玩机技巧
鸿蒙OS适配后，相比EMUI新增了九大功能！赶快保存或者手机搜索玩机技巧。一、HarmonyOs 桌面提供了服务卡片、大文件夹与小艺建议,让操作更便捷、桌面更美观。服务卡片:无需打开应用,可快速预览应用信息或使用常用功能。将不同
# 2023-02-09
荣耀手机也能升级鸿蒙系统，可升级的机型名单已公布
昨天晚上，华为正式发布了HarmonyOS 2手机操作系统，一大批华为手机终端产品均可升级，对于荣耀用户来说，也十分关心自己的机型是否可以升级鸿蒙系统。昨天晚上，荣耀官方也同步公布了HarmonyOS 2可升级机型清单。根据荣耀官方的消
# 2023-02-09
harmonyos可以玩原神吗
harmonyos可以玩原神。根据天眼查显示，HarmonyOS2系列，现已推送到多款机型中将正在游玩的《原神》一键从Mate40Pro转到MatePad上。《原神》是由上海米哈游制作发行的一款开放世界冒险游戏。华为于7月12日宣布，H
# 2023-02-09
华为三款新机上市：预装HarmonyOS系统，但不支持5G，3699元起
大家都知道现在的手机市场主要还以5G手机为主，但深受芯片限制的华为也不得不再把4G手机拿出来“炒冷饭”。今日零点，华为多款4G新机正式开售，分别是华为Mate40 Pro 4G、Mate40E 4G以及nova8 Pro 4G。在5G
# 2023-02-09
LIO一AN00是怎样截滚动长屏？
一、使用隔空手势截取屏幕1.进入设置 &gt辅助功能 &gt智慧感知 &gt隔空截屏，确保隔空截屏开关已开启。2.将手掌朝向屏幕，放在在距离屏幕半臂的位置稍作停顿，待屏幕上方出现后小手后，握拳截屏。二、指关节截取屏

《Discovering Statistics Using R》笔记6-箱形图和离群值

2023-02-22 00:58:02Python09

《Discovering Statistics Using R》笔记6-箱形图和离群值,第1张

新冠肺炎疫情期间本职工作比较忙。。。好久没更新了OTL

读《Discovering Statistics Using R》第四章 Exploring data with graphs中的4.7节箱形图以及5.8.1节处理离群值做的笔记。主要是介绍箱形图和离群值。之前本系列笔记跳过了第四章的内容，因为对于用R作图我打算另开文集来写的。特意又跳回4.7节是因为按照之前笔记顺序该做如何处理离群值的内容了。

一个生物学家怀疑音乐节会对人的健康产生影响，他找了810个音乐会观众，收集了音乐节三天他们的卫生情况，卫生情况得分0-4.我们使用该数据的未去除极端值的版本 DownloadFestival.dat

箱形图是展示连续性变量情况很好的方法。

箱体的中间表示中位数

箱体的两端表示为下四分位数(Q1)和上四分位数(Q3)

箱体两端向外分出两条“触须”，触须长度不超过1.5倍的四分位间距（interquartile range IQR=Q3-Q1）

接下来我们使用箱形图来分性别（gender）展示示例数据中第一天卫生评分的情况（day1）:

在生成的箱形图中我们可以看到女性组里有一个明显的离群值（outlier）。

离群值（outlier）也叫异常值，简单来说就是与其他数据点明显不同的测量值。在箱形图中：

大于上四分位数+1.5倍四分位间距的值或者小于下四分位数-1.5倍四分位间距的值被定义为离群值。

大于上四分位数+3倍四分位间距的值或者小于下四分位数-3倍四分位间距的值被定义为极端离群值(extreme outliers）。

离群值对一些统计量影响很大（比如均值），因此有时需要留意。

我们对原始数据按照day1变量降序排列后可以找到那个离群值：

发现离群值后有几种常用方法可以减少离群值对分析的影响。在应用这些方法前需要先检查一下离群值是否是数据错误录入造成。如果数据录入无误，主要有三种处理方法：

有理由认为这个20.02的离群值应该是2.02由于错误录入造成的。这时应该去找原始数据进行核实。假设我们经核实确实应该是2.02，现在把它改正。

这里我使用 dplyr 包的 if_else（）进行数据修改，其用法和R自带的 ifelse() 基本一致： if_else(condition, true, false, missing = NULL) ,当 condition 的判断为TRUE时返回 true 参数的值，当 condition 的判断为FALSE时返回 false 参数的值。

修改后再做一次箱形图：

从箱形图中我们可以看出数据分布的范围、中位数水平、中间50%的数据分布的范围（箱体）、最高25%的数据分布范围和最低25%的数据分布范围。通过箱形图还可以看出数据分布是否对称：如果上下触须长度相近则数据分布大致对称。另外，触须以外的点展示了离群值的情况。

目录

vcf数据里除了位点的ATGC的对比，进行纯合/杂合判断的以外。还有一个重要的项目就是 DP ，测序深度。测序深度不仅是看测序质量的重要参考，也是对染色体倍数体以及基因拷贝数进行评估的重要指标。

一般的VCF文件都很大，用手动提取里面的信息肯定不大现实。用 vcfR 就可以轻松实现。

查看一下R读取的数据。

选取我们需要的部分也就是Genotype Section里的 DP 区域。

众所周知箱状图的特点就是(boxplot)包含了所有的信息，包括异常值outlier。正因为这个原因，这张图很大程度上受到了这些异常值的影响，变得非常难懂。自己看看还可以，用来发表文章的话肯定不行。

经过log2转换，我们可以得到理想的效果。

又或者不需要转换，而是通过过滤数据来改善箱图效果。举个例子，提取90%的信赖区间的数据来可视化。

这样也可以获得类似的结果。

四分数据位数间距触须

# 上一篇：圣诞节快乐的代码

# 下一篇：JAVA中如何通过IP和端口连接到远程计算机并读取文件？