销售数据分析 (python)

Python015

销售数据分析 (python),第1张

- 数据有15列,327047行,没有空值

- MonthID,itemID,LocationID 需要修改数据类型,新添加列Month,方便按月进行统计

- 把列ItemID,Location 改成字符串类型

- 把MonthID修改成日期型,添加一列Month类型是整型

- 销售价格和数量中都有负数,估计应该是退货,可以统计一些退货的情况

- 销售价格中位数7,平均值是19,数据右偏,最大值是3357,可以统计一下大客户的情况在总体中的情况

- 销售价格大部分在1000以内,深入局部

- 取1000以内的数据分布好像都在400以内了

- 退单的金额大都在-100以内

- 大单的分布在2000-3500之前,3500 之后又极值

- 查看一下极值,根据实际情况分析一下

思路:- 分析大客户2/8原则找出最有生产力的客户

- 分析员工,看那些员工最有战斗力

- 分析用户的类别,看那些类别客户产出多。

- 客户数怎么这么少啊,如果按照销量,重点服务客户应该放在前25销量的客户

- 类别中金额卖的最多的是020-Mens,050-shoes,040-Juniors,030-kids,  跟 类别销售数量最多的不一样,找找原因,重点推荐金额占比高的

- 折扣在010womens中上升了6个百分点,打折对这类商品很有用。

- 处理一下极值

-  价格和销售数量规律性增长

- 退货销售额在销售额,打折销售销售额占比不足1%

- 商店尺寸的大小和销量关系不明显。

- 一共有10个区域,有5个区域加起来的的销售额占了总销售额的80%。

总结:(1)客户购买分布呈现2:8分布,可以重点服务大客户

(2)新店的份额较低,是不是可以做些推广活动

(3)重点分析一下落后区域的市场原因。

在电脑上进行操作

1、首先打开sublime text 3,新建一个PY文件。

2、输入import openpyxl第一步是引入第三方库,如果没有安装会有提示。

3、没有安装的话需要到命令行窗口中,输入pip install openpyxl来进行安装。

4、这里创建了一个excel文件作为示范,先看看是否能打开。

5、file = openpyxl.load_workbook("test.xlsx"),把文件保存在变量里面,然后测试一下是否能读取

6、最后输入sheet=file.get_sheet_by_name("Sheet1")for i in sheet["A1":"C3"]:for j in i:print(j.coordinate, j.value),就能够指定哪个表,然后指定范围,统计数据了。