读文件
要以读文件的模式打开一个文件对象,使用Python内置的 open() 函数,传入文件名和标示符:
>>> f = open('Usersmichael/test.txt', 'r')
标示符'r'表示读,这样,我们就成功地打开了一个文件。
如果文件不存在, open() 函数就会抛出一个 IOError 的错误,并且给出错误码和详细的信息告诉你文件不存在:
>>> f=open('Usersmichael/notfound.txt', 'r')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
FileNotFoundError: [Errno 2] No such file or directory: 'Usersmichael/notfound.txt'
如果文件打开成功,接下来,调用 read() 方法可以一次读取文件的全部内容,Python把内容读到内存,用一个 str 对象表示:
>>> f.read()
'Hello, world!'
最后一步是调用 close() 方法关闭文件。文件使用完毕后必须关闭,因为文件对象会占用操作系统的资源,并且操作系统同一时间能打开的文件数量也是有限的:
>>> f.close()
由于文件读写时都有可能产生 IOError ,一旦出错,后面的 f.close() 就不会调用。所以,为了保证无论是否出错都能正确地关闭文件,我们可以使用 try … finally 来实现:
try:
f = open('pathto/file', 'r')
print(f.read())
finally:
if f:
f.close()
但是每次都这么写实在太繁琐,所以,Python引入了 with 语句来自动帮我们调用 close() 方法:
with open('pathto/file', 'r') as f:
print(f.read())
这和前面的 try … finally 是一样的,但是代码更佳简洁,并且不必调用 f.close() 方法。
调用 read() 会一次性读取文件的全部内容,如果文件有10G,内存就爆了,所以,要保险起见,可以反复调用 read(size) 方法,每次最多读取size个字节的内容。另外,调用 readline() 可以每次读取一行内容,调用 readlines() 一次读取所有内容并按行返回 list 。因此,要根据需要决定怎么调用。
如果文件很小, read() 一次性读取最方便;如果不能确定文件大小,反复调用 read(size) 比较保险;如果是配置文件,调用 readlines() 最方便:
for line in f.readlines():
print(line.strip()) # 把末尾的'\n'删掉