Python操作Excel实现自动化报表

Python018

Python操作Excel实现自动化报表,第1张

Python操作Excel实现自动化报表

安装

python -m pip install xlrd xlwt xlutils。

基本用法

1.从指定文件路径读取excel表格,进行一定操作,然后保存到另一个excel文件:result.xlsx

import xlwt

import xlrd

from xlutils.copy import copy

import pandas as pd

from pandas import DataFrame,Series

import os

os.chdir('./')

# 从指定文件路径读取excel表格

df = pd.read_excel('D:/mypaper/data/data.xlsx')

# 查看df内容

# 根据age算出出生年份,增加一列

import datetime

import os

year = datetime.datetime.now().year#获取当前系统时间对应的年份

df['birth'] = year-df['age']

df.to_excel('result.xlsx')#保存到当前工作目录,可以用os.getcwd()查看

#查看下此时df的内容,可以看到已经生成了birth这一列。

2.单元格操作

# 定义方法:读取指定目录下Excel文件某个sheet单元格的值

def excel_read(file_path,table,x,y):

     data = xlrd.open_workbook(file_path)

     table = data.sheet_by_name(table)

     return table.cell(y,x).value

# 定义方法:单元格值及样式

write_obj_list = []

def concat_obj(cols,rows,value):

    write_obj_list.append({'cols':cols,'rows':rows,'value':value,\

'style':xlwt.easyxf('font: name 宋体,height 280alignment: horiz centre')})

# 定义方法:合并单元格

def merge_unit(srows,erows,scols,ecols,value):

    write_obj_list.append({'id':'merge','srows':srows,'erows':erows,'scols':scols,\

'ecols':ecols,'value':value,'style':xlwt.easyxf('font: name 宋体,height 280alignment: horiz centre')})

# 定义方法:更新excel

excel_update(file_path,write_obj_list,new_path):

    old_excel = xlrd.open_workbook(file_path, formatting_info=True)

    #管道作用

    new_excel = copy(old_excel)

    '''

    通过get_sheet()获取的sheet有write()方法

    '''

    sheet1 = new_excel.get_sheet(0)

    '''

    1代表是修改第几个工作表里,从0开始算是第一个。此处修改第一个工作表

    '''

    for item in write_obj_list:

        if 'id' not in item.keys():

            if 'style' in item.keys():

                sheet1.write(item['rows'], item['cols'], item['value'],item['style'])

            else:

                sheet1.write(item['rows'], item['cols'], item['value'])

        else:

            if 'style' in item.keys():

                sheet1.write_merge(item['srows'],item['erows'],item['scols'], item['ecols'], item['value'],item['style'])

            else:

                sheet1.write_merge(item['srows'],item['erows'],item['scols'], item['ecols'], item['value'])

    '''

   如果报错 dict_items has no attributes sort

    把syle源码中--alist.sort() 修改为----> sorted(alist) 

    一共修改2次

    '''

    new_excel.save(file_path)

#参数详解

# srows:合并的起始行数

# erows:合并的结束行数

# scols:合并的起始列数

# ecols:合并的结束列数 

# value:合并单元格后的填充值

# style:合并后填充风格:

#     font: name 宋体

#     height 280

#     alignment: horiz centre

#     ... 与excel操作基本保持一致

(注意:该方法仅仅是将需要直行的动作保存到一个list中,真正的动作还未执行,执行动作是发生在excel_update方法中)

最终调用excel_update方法,传入每个单元格需要进行的操作和填充值的write_obj_list以及文件保存路径file_path,就可以在当前工作目录下生成想要的Excel结果文件。

注意:

1.write_obj_list支持用户自定义

2.write_obj_list也可以是根据excel_read方法读取现有待修改的excel文件(可以维持原有表格的格式)而生成

End

首先我们安装的python和PyQt5要保持一致,要么都是32位或者都是64位。

下载安装,安装完成之后我们记得要设置环境变量。

一路选择“下一步”就可以了。

相关推荐:《Python基础教程》

安装完成之后我们需要验证是否成功。

pyqt5的安装直接安装就可以的,主要更改环境变量~~python_3.5.2Libsite-packagesPyQt5

eric6安装,直接安装,安装完成之后如图,大家也可以安装汉化包版。

打开如图,我们就可以使用这个开发环境设计报表系统了。

然后使用pycharm安装openpyxl包。

这样,我们就可以使用这个开发环境,开发报表系统了。

统计网站访问量

统计出每个IP的访问量有多少?(从日志文件中查找)

#!/usr/bin/env python

#!coding=utf-8

list = []

f = file('/tmp/1.log')

str1 = f.readlines()

f.close()

for i in str1:

ip = i.split()[0] //split()通过指定分隔符对字符串进行切片,默认为所有的空字符;split分隔后是一个列表,[0]表示取其第一个元素;

list.append(ip) //追加

list_num = set(list)

for j in list_num:

num = list.count(j)

print '%s : %s' %(j,num)

生成报表

#_*_coding:utf-8_*_

import MySQLdb

import xlwt

from datetime import datetime

def get_data(sql):

# 创建数据库连接.

conn = MySQLdb.connect(host='127.0.0.1',user='root'\

,passwd='123456',db='test',port=3306,charset='utf8')

# 创建游标

cur = conn.cursor()

# 执行查询,

cur.execute(sql)

# 由于查询语句仅会返回受影响的记录条数并不会返回数据库中实际的值,所以此处需要fetchall()来获取所有内容。

result = cur.fetchall()

#关闭游标

cur.close()

#关闭数据库连接

conn.close

# 返给结果给函数调用者。

return result

def write_data_to_excel(name,sql):

# 将sql作为参数传递调用get_data并将结果赋值给result,(result为一个嵌套元组)

result = get_data(sql)

# 实例化一个Workbook()对象(即excel文件)

wbk = xlwt.Workbook()

# 新建一个名为Sheet1的excel sheet。此处的cell_overwrite_ok =True是为了能对同一个单元格重复操作。

sheet = wbk.add_sheet('Sheet1',cell_overwrite_ok=True)

# 获取当前日期,得到一个datetime对象如:(2016, 8, 9, 23, 12, 23, 424000)

today = datetime.today()

# 将获取到的datetime对象仅取日期如:2016-8-9

today_date = datetime.date(today)

# 遍历result中的没个元素。

for i in xrange(len(result)):

#对result的每个子元素作遍历,

for j in xrange(len(result[i])):

#将每一行的每个元素按行号i,列号j,写入到excel中。

sheet.write(i,j,result[i][j])

# 以传递的name+当前日期作为excel名称保存。

wbk.save(name+str(today_date)+'.xls')

# 如果该文件不是被import,则执行下面代码。

if __name__ == '__main__':

#定义一个字典,key为对应的数据类型也用作excel命名,value为查询语句

db_dict = {'test':'select * from student'}

# 遍历字典每个元素的key和value。

for k,v in db_dict.items():

# 用字典的每个key和value调用write_data_to_excel函数。

write_data_to_excel(k,v)