python3二进制文件读写直接加b不行吗

2023-02-24 19:45:02Python021

python3二进制文件读写直接加b不行吗,第1张

二进制模式，通常用来读取图片、视频等二进制文件。注意，它在读写的时候是以bytes类型读写的，因此获得的是一个bytes对象而不是字符串。在这个读写过程中，需要自己指定编码格式。在使用带b的模式时一定要注意传入的数据类型，确保为bytes类型。

s = 'this is a test'

b = bytes(s,encoding='utf-8')

f = open('test.txt','w')

f.write(s)

##这样没问题，正常写入了文件。

##-------------------------------------------------

s = 'this is a test'

b = bytes(s,encoding='utf-8')

f = open('test.txt','wb')##注意多了个b

f.write(s)

##报错

TypeError: a bytes-like object is required, not 'str'

##意思是它需要一个bytes类型数据，你却给了个字符串

##---------------------------------------------------

s = 'this is a test'

b = bytes(s,encoding='utf-8')

f = open('test.txt','wb')##注意多了个b

f.write(b)##将变量b传给它，b是个bytes类型

二、 + 模式：

对于w+模式，在读写之前都会清空文件的内容，建议不要使用！

对于a+模式，永远只能在文件的末尾写入，有局限性，建议不要使用！

对于r+模式，也就是读写模式，配合seek()和tell()方法，可以实现更多操作。

三、编码问题

要读取非UTF-8编码的文件，需要给open()函数传入encoding参数，例如，读取GBK编码的文件：

>>>f = open('gbk.txt', 'r', encoding='gbk')

>>>f.read()

'GBK'

遇到有些编码不规范的文件，可能会抛出UnicodeDecodeError异常，这表示在文件中可能夹杂了一些非法编码的字符。遇到这种情况，可以提供errors参数，表示如果遇到编码错误后如何处理。

>>>f = open('gbk.txt', 'r', encoding='gbk', errors='ignore')

四、文件对象操作

每当我们用open方法打开一个文件时，将返回一个文件对象。这个对象内置了很多操作方法。下面假设，已经打开了一个f文件对象。

1. f.read(size)

读取一定大小的数据, 然后作为字符串或字节对象返回。size是一个可选的数字类型的参数，用于指定读取的数据量。当size被忽略了或者为负值，那么该文件的所有内容都将被读取并且返回。

f = open("1.txt", "r")

str = f.read()

print(str)

f.close()

如果文件体积较大，请不要使用read()方法一次性读入内存，而是read(512)这种一点一点的读。

2. f.readline()

从文件中读取一行n内容。换行符为' '。如果返回一个空字符串，说明已经已经读取到最后一行。这种方法，通常是读一行，处理一行，并且不能回头，只能前进，读过的行不能再读了。

f = open("1.txt", "r")

str = f.readline()

print(str)

f.close()

3. f.readlines()

将文件中所有的行，一行一行全部读入一个列表内，按顺序一个一个作为列表的元素，并返回这个列表。readlines方法会一次性将文件全部读入内存，所以也存在一定的风险。但是它有个好处，每行都保存在列表里，可以随意存取。

f = open("1.txt", "r")

a = f.readlines()

print(a)

f.close()

4. 遍历文件

实际上，更多的时候，我们将文件对象作为一个迭代器来使用。

# 打开一个文件

f = open("1.txt", "r")

for line in f:

print(line, end='')

# 关闭打开的文件

f.close()

这个方法很简单, 不需要将文件一次性读出，但是同样没有提供一个很好的控制，与readline方法一样只能前进，不能回退。

几种不同的读取和遍历文件的方法比较：如果文件很小，read()一次性读取最方便；如果不能确定文件大小，反复调用read(size)比较保险；如果是配置文件，调用readlines()最方便。普通情况，使用for循环更好，速度更快。

5. f.write()

将字符串或bytes类型的数据写入文件内。write()动作可以多次重复进行，其实都是在内存中的操作，并不会立刻写回硬盘，直到执行close()方法后，才会将所有的写入操作反映到硬盘上。在这过程中，如果想将内存中的修改，立刻保存到硬盘上，可以使用f.flush()方法，但这可能造成数据的不一致。

# 打开一个文件

f = open("/tmp/foo.txt", "w")

f.write("Python 是一种非常好的语言。

我喜欢Python!!

# 关闭打开的文件

f.close()

6. f.tell()

返回文件读写指针当前所处的位置,它是从文件开头开始算起的字节数。一定要注意了，是字节数，不是字符数。

7. f.seek()

如果要改变位置指针的位置, 可以使用f.seek(offset, from_what)方法。seek()经常和tell()方法配合使用。

from_what的值，如果是0表示从文件开头计算，如果是1表示从文件读写指针的当前位置开始计算，2表示从文件的结尾开始计算，默认为0，例如：

offset：表示偏移量。

seek(x,0) ：从起始位置即文件首行首字符开始移动 x 个字符

seek(x,1) ：表示从当前位置往后移动x个字符

seek(-x,2)：表示从文件的结尾往前移动x个字符

看一个例子：

>>>f = open("d:\1.txt", "rb+")

>>>f.write(b"1232312adsfalafds")

>>>f.tell()

>>>f.seek(5)

>>>f.read(1)

b'1'

>>>f.seek(-3, 2)

>>>f.read(1)

b'f'

8. f.close()

关闭文件对象。当处理完一个文件后，调用f.close()来关闭文件并释放系统的资源。文件关闭后，如果尝试再次调用该文件对象，则会抛出异常。忘记调用close()的后果是数据可能只写了一部分到磁盘，剩下的丢失了，或者更糟糕的结果。也就是说大象塞进冰箱后，一定不要忘记关上冰箱的门。

我们之前使用open方法读取文件

细心的朋友应该注意到，我们用open()打开文件以后，后面会跟着一个f.close()方法用来关闭文件，但是每次这么写，会很麻烦。

所以，我们接下来介绍一下with open()的用法

调用read()方法，会一次性读取全部文件内容，当文件内容较小时比较试用，但是当文件内容过大，很容易导致运行内存100%，所以我们可以反复调用read(size)来设置每次读取的字节内容。

写入文件内容时：

我们写入文件内容时，系统并不会立刻就把所有数据写入到磁盘，它是先放到内存中缓存，等到空闲的时候再慢慢写入到磁盘。

当调用close()方法时，系统才能保证把剩余没有写入的数据全部写入到磁盘。假如我们忘记调用了close()方法，那很可能导致我们的数据遗失。

为了保证万无一失，最好是使用with open()进行内容的读写。

try...finally

我在之前的文章里面讲过try...finally，finally里面的内容是不管是否发生异常都会被执行。

所以，对于open()方法我们有另一种写法：

但是呢，这种方法相比with open()实在是太麻烦了，所以我们只是简单说一下，并不建议大家去使用这个方法。

多个文件的读写方式

with open()和open()读写文件的方法是通用的，没有区别

文件方法如果内容对象

# 上一篇：如何在64位win7系统中搭建R语言

# 下一篇：april什么意思

推荐阅读

热门文章

最新发布

标签列表

python3二进制文件读写直接加b不行吗

给您推荐相同类型的内容：