Python获取文件信息

2023-02-25 18:32:01Python09

Python获取文件信息,第1张

#-*- coding: utf-8 -*-

import os

#已知文件名的情况下，可以用这个函数

def getFileInfo(filepath):

info = {}

if os.path.isfile(filepath):

info['TimeCreated'] = os.path.getctime(filepath)

info['TimeModified'] = os.path.getatime(filepath)

info['Size'] = os.path.getsize(filepath)

return info

# 如果只知道文件根目录，但是不知道具体的文件路径,

# 可以先用os.listdir获得文件和文件夹列表

#-------------------分界线----------------------

# 这是回答你的第二个问题。如何找到一个字符串中指定两个字符中间的字符串

# 这里用的是正则表达式

import re

special = "*.?+$^[](){}|\/" #正则表达式中会出现的特殊字符

# 输入参数为原始字符，leftmark表示左边的分隔符号，rightmark表示右边的分隔符号

#函数返回在leftmark和rightmark中间的内容,可能匹配满足不止一次,没有找到就返回空

def matchpattern(str1,leftmark,rightmark):

lf,rt = leftmark,rightmark

#如果需要匹配的字符在正则表达式中时特殊字符，需要给予转义

if leftmark in special:

lf = '\%s'%leftmark

if rightmark in special:

rt = '\%s'%rightmark

pattern = re.compile(r''+lf + '.{0,}'+ rt)

matched = re.findall(pattern,str1)

result = []

if matched:

#如果匹配成功了，就去头去尾，直接取中间的部分

for m in matched:

s = m.replace(leftmark, '')

s = s.replace(rightmark, '')

result.append(s)

return result

else:

return None

if __name__ == '__main__':

print matchpattern("#abcsdfs%sdfsdf*",'%','*')

open(filename[,mode,encoding="编码"]) ：第一个参数文件名如果不加路径，默认在该py文件目录下（路径举例： E:/XXX或E:\\xxx ），第二个是模式，默认为 'r' ——只读，举例： f = open('E:/abc.txt') ，如果要转编码并写入模式：

f = open('E:/abc.txt','w',encoding='utf-8')

1. 模式

2. 方法

(1) close() : 关闭文件，因为文件写入时是写在内存，只有关闭时才写入硬盘，所以写完记得关闭

(2) read(size = -1) ：读取文件size个字符，不写默认是-1，此时读取所有内容（换行按\n来表示，很不好看），并作为字符串返回，一定要注意 读完以后文件指针将会指向末尾 ，所以下一次在用read方法时会发现读取不出内容了，所以这个就要用seek移动指针或者关闭文件重新定义

(3) tell() ：返回当前文件指针指向的位置

(4) seek(offset,from) ：移动文件指针，代表从from参数开始偏移offset个字节，0代表起始位置，1代表当前位置，2代表文件末尾

(5) readline() ：按序列读取一行内容，默认\n为边界

(6) write() ：写入内容，但必须要有写入权限才行，否则报错，写完会返回写入的长度，例如： len1 = f.write('abc') ，此时len1就为3

(7) truncate() ：删除内容，把当前指针以后的内容全删了，举例：

注：

1.文件还可以转化为 list 之类的，例如： list1 = list(f) ，此时文件内容的按\n被隔开，然后可以用for语句读取文件所有内容，举例：

2.上面输出文件内容方法相对低效，所以一般都直接用for输出整个文件，举例：

通过 fileno 函数，我们可以查看一个文件对应的文件描述符，对应的是程序中打开的文件序号，举例：

可以看出python在启动时会先启动标准流的文件（文件描述符分别为：0/1/2），所以之后打开的文件就从3开始递增，当释放一个文件资源时，该描述符序号被释放，之后打开的文件可以继续使用该序号的文件描述符

python中的 print 的本质是通过 sys.stdout 来进行内容输出，而 sys.stdout 的本质是一个"文件"，相当于我们所有的输入输出的本质都是在对 sys.stdin / sys.stdout / sys.stderr 这些文件来进行读写操作，举例：

open 函数不仅可以打开本地文件，也可以打开文件描述符，而该参数默认为 True ，代表 close 后会将对应的文件资源释放，而对于一些文件描述符，我们只是希望 close 时将打开文件描述符的对象释放，而不释放对应的文件资源，那么则可以设置 closefd=False ，举例：

需要使用到 chardet 模块，按二进制可读打开文件，然后通过 detect() 方法查看，举例：

所以就可以根据文件来设置编码了：

有时候使用文件的编码解码也可能会出现无法解析的情况，例如两种编码混在同一个文件里的时候，此时可以设置 errors 参数为 ignore 来避免该问题，示例：

可用 os 模块下的 chmod() 函数，具体参考： http://www.runoob.com/python/os-chmod.html

使用 os 模块下的 remove() 函数可以实现删除文件，举例：

可以使用自带的 zipfile 模块来进行操作，举例：

可以使用自带的 tarfile 模块来进行操作，举例：

https://www.cnblogs.com/lotusto/p/5805543.html

你是指读入二进制文件吧？\x0d\x0a可以使用numpy.fromfile()，也可以使用open(filename, 'rb')，其中的'b'就是二进制的意思，然后使用文件类型的read方法，读取一些字节，再用struct.unpack()方法来解析二进制。\x0d\x0a第一种方法是一次性读入文件（或文件的前多少个连续字节）到一个数组中，因此，灵活性差。\x0d\x0a第二种方法灵活性很高，可以读取任意位置（使用文件的seek()方法跳跃位置）的二进制数据，再使用struct.unpack()方法来进行各种二进制解析。\x0d\x0a\x0d\x0a提示：二进制文件是不保留存储方式的数据格式，因此，读二进制文件时应该知道二进制文件的存储格式。

文件内容函数指针所以

# 上一篇：Ruby如何进行文件操作

# 下一篇：C语言中!y与y!的区别