1 如何用Python导入Excel以及csv数据集

Python012

1 如何用Python导入Excel以及csv数据集,第1张

Excel是一个二进制文件,它保存有关工作簿中所有工作表的信息 CSV代表Comma Separated Values 。这是一个纯文本格式,用逗号分隔一系列值 Excel不仅可以存储数据,还可以对数据进行操作 CSV文件只是一个文本文件,它存储数据,但不包含格式,公式,宏等。它也被称为平面文件 Excel是一个电子表格,将文件保存为自己的专有格式,即xls或xlsx CSV是将表格信息保存为扩展名为.csv的分隔文本文件的格式 保存在excel中的文件不能被文本编辑器打开或编辑 CSV文件可以通过文本编辑器(如记事本)打开或编辑 excel中会有若干个表单,每个表单都会这些属性:  行数(nrows) 列数(ncols) 名称(name) 索引(number)  import xlrd //执行操作前需要导入xlrd库  #读取文件  excel = xlrd.open_workexcel("文件地址") //这里表格名称为excel,文件的地址可以从文件的属性中看到  #读取表格表单数量  sheet_num= excel.nsheets // sheet_num为变量,其值为表格表单数量  #读取表格表单名称  sheet_name = excel.sheet_names() // sheet_name为变量,其值为表格表单名称  #如果想要看到上述两个变量,可以使用print()函数将它们打印出来  #想要读取某个表单的数据,首先获取表单 excel.sheet_by_index(0)  //表单索引从0开始,获取第一个表单对象 excel.sheet_by_name('xxx')  // 获取名为”xxx”的表单对象 excel.sheets()  // 获取所有的表单对象 获取单元格的内容:使用cell_value 方法 这里有两个参数:行号和列号,用来读取指定的单元格内容。  第一行的内容是:sheet.row_values(rowx=0)  第一列的内容是:sheet.col_values(colx=0) CSV是英文Comma Separate Values(逗号分隔值)的缩写,文档的内容是由 “,” 分隔的一列列的数据构成的。在python数据处理中也经常用到。 import csv //执行操作前需要导入csv库  #csv读取  遍历其中数据 csv_file = csv.reader(open(‘文件地址’,’r’)) for x in csv_file print(x)

将txt

文件导入python代码:

import

pandas

as

pd

path='1.txt'

data=pd.read_csv(path,sep='\t')

想要”优雅“导入,建议使用pandas,matplotlib:

import

pandas

as

pd

data

=

pd.read_csv("aaa.csv")

data.columns

#查看表格有哪些列,可以看到有x,

y,

z列

data['x']

#查看x列

data['y']

#查看y列

data['z']

#查看z列

import

matplotlib.pyplot

as

plt

plt.bar(data['x'],

data['y'])

#画柱状图

plt.title('example')

#设置标题

plt.xlabel('x')

#横坐标加说明文字'x'

plt.ylabel('y')

#纵坐标加说明文字'y'

plt.show()

#显示图形