Python csv库整理(部分)

Python013

Python csv库整理(部分),第1张

近期,笔者到一些数据竞赛网站进行观察学习,发现很多数据是以csv文件处理的(废话).因而,磨刀不误砍柴工,笔者先对Python的csv库进行学习.

csv模块实现了CSV格式表单数据的读写.这可以以一个兼容Excel的方式读写其数据文件,csv模块中的reader和writer类被用来读写序列化的数据.也可以使用DictReader类和DictWriter类以字典的方式读取数据.

返回一个reader对象,该对象逐行遍历csvfile(文件和列表均适用,但是文件的话应该newline=''.

默认每一行读取一个字符串组成的列表(而非数值,除非修改QUOTE_NONUMERIC).

返回一个writer对象,负责将数据在给定的文件类对象上转换成带分隔符的字符串.csvfile(只要该对象有write()方法,文件的话应该newline=''.)

这两个方法可以把name字符串和dialect关联/脱钩.dialect可以是Dialect的子类,或者fmtparams的关键字参数.

返回一个Dialect对象为name的变种,若其未注册,抛出Error.

返回已经注册的所有变种的 名称

返回当前解析器允许的最大字段大小,如果制定了参数,参数将成为新的最大字段大小.

该对象操作上类似reader,但是把每行中的信息映射到一个字典,字典的键由fieldnames给出

fieldname的参数是一个序列sequence [1] ,如果参数缺省,默认第一行的值作为字段名.

如果某一行中的字段多于字段名(比如说约定有5项属性,但是这一行却出现了6个数据),则其余字段将放入列表中,字段名由 restkey 指定(默认为 None)。如果非空白行的字段少于字段名,则缺少的值将用 None 填充。

#其实这玩意应该就跟各种填表里面的备注用法差不多.

3.8中返回的行是dict类型.

该对象操作上类似reader,但是把每行中的信息映射到一个字典,字典的键由fieldnames给出,fieldname参数是不可缺省的.restval用来指定字典缺少键的时候要写入的值.extrasaction用于指定关键键在fieldname中找不到的情况的处理机制.'raise'引发ValueError,而'ignore'则会被忽略.

这个类被用来瑞段csv文件的格式

以下诸类均在括号中标注了在其变种注册表中的名称

定义了Excel生成的csv文件的常规属性.('excel')

定义了Excel生成的,tab分割的csv文件的常规属

性.('excel-tab')

定义了UNIX系统上生成的csv文件的常规属性('unix'):

任意可能发生的csv库函数错误.

参考链接

Python3.8.2文档中关于csv库的相关文档

一、文件路径报错

因为在python之中文件路径都是以字符串类型出现的,所以在字符串对象的编写语法本身没有错误时,那么出现报错的唯一原因就是这个文件路径找不到文件。这种问题主要经常出现在已经发布部署到服务器上的python程序,因为在开发时很多时候都是用绝对路径来读取文件的,环境改变之后从磁盘根目录读取的绝对路径就是无法使用了。

二、解决方法

那么正确的做事实际上就是先导入os模块,然后调用getcwd()方法查看当前python程序,也就是py脚本文件处在哪个文件路径之中,代码示例如下所示:

import os

os.getcwd()

print(os.getcwd())

然后再打开文件夹查看一下所要读取的csv文件在哪个文件目录,然后在文件资源管理器内打开csv文件所在的文件目录并将其复制后粘贴到python文件所在的同级目录下,接下来就可以使用绝对不会出错的相对路径来读取该csv文件了。只需要写上csv文件的名称就可以来将其在python程序内打开并读取,代码示例如下所示:

import pandas as pd

train = pd.read_csv

python在使用csv库时必须通过pipinstallcs。在python里面,读取或写入csv文件时,先要通过pipinstallcs安装库,再importcsv这个库,利用这个库提供的方法进行对文件的读写。