- MonthID,itemID,LocationID 需要修改数据类型,新添加列Month,方便按月进行统计
- 把列ItemID,Location 改成字符串类型
- 把MonthID修改成日期型,添加一列Month类型是整型
- 销售价格和数量中都有负数,估计应该是退货,可以统计一些退货的情况
- 销售价格中位数7,平均值是19,数据右偏,最大值是3357,可以统计一下大客户的情况在总体中的情况
- 销售价格大部分在1000以内,深入局部
- 取1000以内的数据分布好像都在400以内了
- 退单的金额大都在-100以内
- 大单的分布在2000-3500之前,3500 之后又极值
- 查看一下极值,根据实际情况分析一下
思路:- 分析大客户2/8原则找出最有生产力的客户
- 分析员工,看那些员工最有战斗力
- 分析用户的类别,看那些类别客户产出多。
- 客户数怎么这么少啊,如果按照销量,重点服务客户应该放在前25销量的客户
- 类别中金额卖的最多的是020-Mens,050-shoes,040-Juniors,030-kids, 跟 类别销售数量最多的不一样,找找原因,重点推荐金额占比高的
- 折扣在010womens中上升了6个百分点,打折对这类商品很有用。
- 处理一下极值
- 价格和销售数量规律性增长
- 退货销售额在销售额,打折销售销售额占比不足1%
- 商店尺寸的大小和销量关系不明显。
- 一共有10个区域,有5个区域加起来的的销售额占了总销售额的80%。
总结:(1)客户购买分布呈现2:8分布,可以重点服务大客户
(2)新店的份额较低,是不是可以做些推广活动
(3)重点分析一下落后区域的市场原因。
在电脑上进行操作1、首先打开sublime text 3,新建一个PY文件。
2、输入import openpyxl第一步是引入第三方库,如果没有安装会有提示。
3、没有安装的话需要到命令行窗口中,输入pip install openpyxl来进行安装。
4、这里创建了一个excel文件作为示范,先看看是否能打开。
5、file = openpyxl.load_workbook("test.xlsx"),把文件保存在变量里面,然后测试一下是否能读取
6、最后输入sheet=file.get_sheet_by_name("Sheet1")for i in sheet["A1":"C3"]:for j in i:print(j.coordinate, j.value),就能够指定哪个表,然后指定范围,统计数据了。