python 代码生成器怎么用

Python015

python 代码生成器怎么用,第1张

生成器是一个包含了特殊关键字yield的函数。当被调用的时候,生成器函数返回一个生成器。可以使用send,throw,close方法让生成器和外界交互。

生成器也是迭代器,但是它不仅仅是迭代器,拥有next方法并且行为和迭代器完全相同。所以生成器也可以用于python的循环中,

生成器如何使用?

首先看一个例子:

复制代码 代码如下:

#!/usr/bin/python

# -*- coding: utf-8 -*-

def flatten(nested):

for sublist in nested:

for element in sublist:

yield element

nested = [[1,2],[3,4],[5,6]]

for num in flatten(nested):

print num,

结果为1,2,3,4,5,6

递归生成器:

复制代码 代码如下:

#!/usr/bin/python

# -*- coding: utf-8 -*-

def flatten(nested):

try:

for sublist in nested:

for element in flatten(sublist):

yield element

except TypeError:

yield nested

for num in flatten([[1,2,3],2,4,[5,[6],7]]):

print num

结果为:1 2 3 2 4 5 6 7

让我们一起来看看生成器的本质

首先看下:

复制代码 代码如下:

#!/usr/bin/python

# -*- coding: utf-8 -*-

def simple_generator():

yield 1

print simple_generator

def repeater(value):

while True:

new = (yield value)

if new is not None: value = new

r = repeater(42)

print r.next()

print r.send('hello,world!')

结果为:

复制代码 代码如下:

<function simple_generator at 0x10c76f6e0>

42

hello,world!

可以看出:

1)生成器就是一函数

2)生成器具有next方法

3)生成器可以使用send 方法和外界交互。

Python批量处理excel数据(含完整代码)

pandas库可以有效的处理excel、csv和txt文件,并能多格式将数据重新保存为excel、csv和txt文件。

1

1

一、导入数据

利用pandas库中的read函数可以将excel文件读入,转化为 DataFrame格式

import pandas as pd

path = "D:\text.xlsx" ##文件路径

data = pd.read_excel(path,sheet_name = 0) ##若包含多个子表,可以用sheet_name参参数进行选择

若excel表中不包含列名信息可以在读入时,利用names参数进行指定

data = pd.read_excel(path,names=["id","name","date"])

对于csv文件可以使用pd.read_csv函数进行数据导入

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

二、空表创建

当输出表格和输入表格的格式不一致时,我们可以通过创建空表来解决问题,新的DataFrame表格的数据可以为空,但是必须设置列名,也就是表头

##利用list创建表头

header = ["name","date","a","b"]

##创建空表

outData = pd.DataFrame(columns=header)

1

2

3

4

5

6

7

1

2

3

4

5

6

7

三、数据增删查改

1.数据查改

利用loc和iloc函数可以对DataFrame 数据表中的数据进行查改,loc使用行名和列名进行调用,iloc使用行列索引进行调用

propoLoc = data.loc["index", "proportion"]

propoIloc = data.loc[0, 0]

data.iloc[:, 5:] = data.iloc[:, 5:].astype(int) ##利用索引可以对数据进行批量处理,此句指令用于将表格第五列至最后一列的格式转化为整型int

2.数据增删

利用drop函数可以删除指定行列,利用loc或insert函数可以增加列,loc用来增加行

data.drop(index=[0], inplace=True) ##删除行名为0的行

data.drop(columns=[0], inplace=True,axis=1) ##删除列名为0的列

data.loc[str(csvName)] = rowData ##增加行名为csvName的行,注意rowData要保证和data的列数一致

data.loc[:,str(csvName)] = 0 ##增加列名为csvName的列,用0填充该列

data.insert(data.shape[1], 'd', 0) ##在data.shape[1]处增加列,并用0填充

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

四、批量处理

首先利用os库对文件夹进行遍历,获得所有的excel文件

import os

excelNames = os.listdir(rootPath) ##获得所有的文件名

for excelName in excelNames:

##对每个文件进行处理

1

2

3

4

5

6

7

1

2

3

4

5

6

7

五、常用的数据处理方法

1.字符串分割 str.split(",") 用逗号进行分割,并创建一个list进行存储

2.str.endswith("hello") 判断字符串的后缀

1

2

1

2

六、表格存储

1.单表存储:将一个sheet放入到一个excel中

saveFile = rootPath+"test.xlsx" ##指定保存文件,注意反复保存时,excel不要打开,否则无法写入

rootData.to_excel(saveFile,index=False) ##保存指定,并不保存行名

2.多表存储:将多个sheet放入到一个excel中

with pd.ExcelWriter('./dataOut.xlsx') as writer:

DFa.to_excel(writer, sheet_name="表1")

DFb.to_excel(writer, sheet_name="表2")

DFc.to_excel(writer, sheet_name="表3")

writer.save()

writer.close()

批量表格处理完整代码:将多张表的信息进行汇总

import os

import pandas as pd

rootPath = "C:\test\"

def createOutCsv(path):

data = pd.read_excel(path, names=["column1", "column2", "column3"])

data.drop(index=[0], inplace=True)

header = ["name"] ###创建表头

for index in data.index: ##利用data中的所有column1创建表头

column = data.loc[index,"name"].split(".")[-1]

header.append(column