python数据分析综合项目--空气质量指数分析

Python011

python数据分析综合项目--空气质量指数分析,第1张

近年来,我国的环境问题比较严重,很多城市出现了雾霾天气,当然也有很多城市空气依旧清新,为了研究具体的空气环境城市分布,我们采用了假设检验以及线性回归的思想对AQI(空气质量指数)进行分析和预测,其中AQI的值越大,表示空气质量越差,AQI值越小,表明空气质量越好。

1.列出空气质量优秀/较差的五个城市

2.全国空气质量分布情况

3.临海城市和内陆城市的空气质量对比

4.影响空气指数的因素

5.空气质量均值验证

City 城市名

AQI 空气质量指数

Precipitation 降雨量

GDP 城市生产总值

Temperature 温度

Longitude 经度

Latitude 纬度

Altitude 海拔高度

PopulationDensity 人口密度

Coastal 是否沿海

GreenCoverageRate 绿化覆盖率

Incineration(10,000ton) 焚烧量(10000吨)

在进行数据分析之前,我们对数据集进行观察并对其中的缺失值、重复值、异常值进行处理

我们发现降雨量数据中包含了4个缺失值,为了保证数据的精确,我们查一下降雨量的数据分布

很明显的呈现右偏分布,因此采用平均数来替代缺失值并不妥,我们这里用中位数来代替

GDP属性中检测出8条异常值,我们这里采取用极端值替换的方式,将异常值替换成最大值

数据集处理完毕之后,我们开始进行数据分析

按照AQI降序排列,选出排名前五以及后五的城市,进行可视化,结果如下

结论:空气质量较好的城市为韶关市、南平市、梅州市、基隆市、三明市,空气质量堪忧的城市分别为焦作市、锦州市、保定市、朝阳市、北京市

这里我们将AQI指数分为六个等级,并根据等级统计全国空气质量的等级情况

我们再用散点图绘制下全国的空气质量分布

结论:我国城市的空气质量集中在一级、二级和三级,高污染城市比例较低;从地理位置来看,西部城市空气质量优于东部城市,南部城市优于北部城市。

根据上面的结论我们发现,仿佛临海城市的空气质量普遍高于内陆地区,那么这个结论是否是真的呢?还需要进一步验证。

首先,我们来统计下不同地理环境的城市数量

第二步,绘制临海和内陆城市的AQI分布图

我们发现内陆城市AQI集中分布在50-100区间内,而沿海城市AQI集中分布在0-50区间,在此样本中,沿海的AQI分布低于内陆城市,但是这毕竟是样本,无法推测出总体分布情况,还需进一步探测。

第三步,统计AQI均值并绘制分布密度图

第四步,差异检验,查看内陆沿海AQI均值分布是否显著

我们先假设内陆城市和沿海城市的平均值相同

结果得出支持的概率为0.006,远低于0.05,因此我们否定原假设,选择备择假设,即内陆城市和沿海城市的平均值不相同

结论:经过分析,我们发现有超过99%的概率可以证明临海城市空气质量优于内陆城市的空气质量。

为了探究影响空气质量的具体因素,我们需要计算出两个变量之间的相关系数,以此进行判断,这里采用热力图进行可视化操作。

结论:从显示结果看出,AQI主要受降雨量和纬度的影响,其中降雨量越多,空气质量越好(0.4);纬度越低,空气质量越好(-0.55)

当然,从整个图片来看,也能发现很多变量之间的关系,比如GDP与焚烧量的正相关系数达到了0.9,温度与纬度的负相关系数达到了-0.81等。

传闻空气质量均值在71左右,这个消息是否是准确的呢?我们进行一次验证。

首先计算样本的均值

结果显示为75.334

那么总体的均值是否为71呢?这里先假设总体的均值为71,进行t检验

结论:可以看出,偏离均值1.81倍的标准差,而且p值大于0.05,我们接受原假设(即空气质量均值在71左右)另外,我们还可以计算出在置信度为95%时,空气质量均值的置信区间为70-80。

Python今年是排名前3的最受欢迎和增长最快的编程语言之一。

它是一种多用途,高级别,面向对象,交互式,解释型和对用户非常友好的编程语言。

那么,Python未来的前景怎么样?就业岗位多不多?薪资高不高?今天就来看一下详细分析。

1、为什么这么多人学Python呢?

很多初学者都听说python很火,可是为啥要学Python,下面谈谈我的感悟。

Python语言是我目前为止用的最爽的语言,因为它真的很优美。虽然C、C++、Java也非常的强大和伟大,但是每一种语言伟大的背后都是有一定的时代背景。

Python被广泛的用在Web开发、运维自动化、测试自动化、数据挖掘等多个行业和领域。

一项专业调查显示,75%的受访者将Python视为主要开发语言,反之,其他25%受访者则将其视为辅助开发语言。

将Python作为主要开发语言的开发者数量逐年递增,这表明Python正在成为越来越多开发者的开发语言选择。

那么未来10年到底哪种语言会独领风骚,笑傲江湖,我不得而知,但是未来10年一定是人工智能,万物互联的时代,现在AI、VR、无人驾驶汽车、无人机、智能家居离我们越来越近了。

未来10年将是大数据,人工智能爆发的时代,到时将会有大量的数据需要处理,而Python最大的优势,就是对数据的处理,有着得天独厚的优势,我相信未来的10年,Python会越来越火。

2、Python岗位需求量10万

从职友集最新Python招聘岗位需求来看,Python工程师的岗位需求量巨大,并且岗位需求量还在呈现上涨的趋势。

全国Python岗位需求量接近10万;

北京岗位需求量居首位为20890个占比21.17%,

上海Python工程师岗位需求量居第二位为12843个占比13.02%,

其次是深圳、杭州、广州等一线城市合计占比16.53%。

从下图可知,Python 相关职位的需求量,依然集中在三大经济圈,特别是在北京、上海、深圳这几个城市。

3、Python就业薪资水涨船高

从职友集最新Python招聘岗位需求来看,Python工程师的岗位需求量巨大,并且岗位需求量还在呈现上涨的趋势。

从市场整体需求来看,Python在招聘市场上的流行程度也是在逐步上升的,工资水平也是水涨船高。

一张图可以看清现在Python的就业薪资:

以上为Python各方向薪资

因为Python在大数据和人工智能领域的爆发性发展, 导致Python方向岗位的薪水在水涨船高,从数据分析来看,月薪在20K-50K不等。

学习Python的程序员,除了能从事Python开发工程师、人工智能工程师、数据分析师、Python自动化测试外,也能够朝着Python游戏开发工程师、SEO工程师、Linux运维工程师等方向发展,发展方向较为多元化。

说这么多之后,你会发现,Python的发展前景十分广阔。并且Python是一门真正意义上的全栈语言,即使目前世界上使用最广泛的Java语言,在很多方面与Python相比也逊色很多!所以,你想学习Python了吗?