一、 可读可写:
# r+t :可读可写 一打开光标就在开始位置 直接写将导致原始数据被覆盖# w+t:可读可写 一打开光标就在开始位置 会把原始全都清空了 要使用可读可写模式 首先要保证 你知道数据是如何编码的# a+t : 可读可写 一打开光标就在文件末尾with open('a.txt',mode='r+t',encoding='utf-8') as f: print(f.readable()) #判断是否可读 print(f.writable()) #判断是否可写 msg=f.readline() #只读一行 print(msg) f.write('xxxxxxxxxxx\n')----------------------------------------------------TrueTrue
a.txt
xxxxxxxxxxx \n (回车)
二、控制文件内的指针移动
# 文件内指针移动,只有t模式下的read(n),n代表的字符的个数
# 除此以外文件内指针的移动都是以字节为单位with open('a.txt',mode='rt',encoding='utf-8') as f: msg=f.read(1) #()不写全部读 print(msg)-------------------------------x
# 使用b模式打开后转成文本模式的使用decode解码(指定编码格式)with open('a.txt',mode='rb') as f: msg=f.read(3) print(msg.decode('utf-8'))-------------------------------------------xxx
a.txt
xxxxxxxxxxx (\n 回车)
# f.seek(offset,whence)有两个参数:
# offset: 代表控制指针移动的字节数# whence: 代表参照什么位置进行移动# whence = 0: 参照文件开头(默认的),特殊???,可以在t和b模式下使用# whence = 1: 参照当前所在的位置,必须在b模式下用# whence = 2: 参照文件末尾,必须在b模式下用a.txt
123456789
py
with open('a.txt',mode='rt',encoding='utf-8') as f: f.seek(6,0) #从文件开头,print 时会读到下一个 msg=f.read(1) print(msg)-------------------------------------------------------------7 with open('a.txt',mode='rb') as f: f.seek(3,0) msg=f.read(3) print(msg.decode('utf-8')) -------------------------------------------456 with open('a.txt',mode='rb') as f: # utf-8中 b:模式是读:“字节”(3个字节是一个字符) t:模式是字符(一个汉字) msg=f.read(3) print(msg.decode('utf-8')) print(f.tell()) # f.seek(6,0) f.seek(3,1) msg1=f.read(3) print(msg1.decode('utf-8')) ---------------------------------------------------1233789# 接上面 例子: with open("a.txt",'rb')as f: f.seek(8,0) print(f.read(1).decode('utf-8')) # utf-8中 f.read("字节") b:模式是读:“字节”(3个字节是一个字符) t:模式是字符(一个汉字) # 取字符e # 取到第2个t # 如果一行都是(utf-8)中文,(b模式)都是按照3个字节是一个字符来算,若有中文也有英文,f.read(1) 应该按照一个字节取,中文还是算3个,若全是中文应该是f.read(3) # 因为3个字节一个中文
a.txt
×××123456789jkljkljhkljhkl
1.py
with open('a.txt',mode='rb') as f: msg=f.read(3) print(msg.decode('utf-8')) print(f.tell()) #统计文件的字符数,utf-8中 一个中文字符占3个字节数 # f.seek(6,0) # #0模式,是0模式往后移动的位置再在当前光标处继续移动 字节(b模式的话)。 f.seek(3,1) #如果最开始用1模式的话,是与0模式效果一样,因为都是从光标开头出开始 msg1=f.read(3) print(msg1.decode('utf-8'))----------------------------------------------中3人
py
with open('a.txt',mode='rb') as f: # f.seek(0,2) # print(f.tell()) f.seek(-3,2) # 2模式前面必须是负数,因为正数的话是往后取值(2模式本来就是文件末尾) msg=f.read(3) print(msg.decode('utf-8'))--------------------------------------hkl
with open('access.log',mode='rb') as f: f.seek(0,2) # 当前位置是147bytes while True: line=f.readline() # 当前位置是196bytes # print(f.tell()) if len(line) == 0: # 没有新的一行内容追加进来 pass else: # 有新的一行内容追加进来 print(line.decode('utf-8'),end='')
with open('access.log',mode='rb') as f: f.seek(0,2) # 当前位置是147bytes while True: line=f.readline() # 当前位置是196bytes if len(line) != 0: print(line.decode('utf-8'),end='')
with open('a.txt',mode='r+t',encoding='utf-8') as f: f.truncate(6)
a.txt (旧)
×××
a.txt (新)
中华
import timewith open('access.log','at',encoding='utf-8') as f: f.write('%s alex给egon转账了1个亿\n' %time.strftime('%Y-%m-%d %H:%M:%S'))
三、文件修改的两种方式
# 修改文件的方式一:
# 1 将文件内容由硬盘全部读入内存# 2 在内存中完成修改# 3 将内存中修改后的结果覆盖写回硬盘a.txt
alex
py (将文件a.txt中的alex修改成为"dsb")
with open('a.txt',mode='rt',encoding='utf-8') as f: all_data=f.read()print(all_data,type(all_data))with open('a.txt',mode='wt',encoding='utf-8') as f: f.write(all_data.replace('alex','dsb'))
# 修改文件的方式二: (将文件a.txt中的"alex"修改成为"dsb")
# 1 以读的方式打开源文件,以写的方式打开一个临时文件
# 2 从源文件中每读一样内容修改完毕后写入临时文件,直到源文件读取完毕# 3 删掉源文件,将临时文件重命名为源文件名import oswith open('a.txt',mode='rt',encoding='utf-8') as read_f,open('.a.txt.swap',mode='wt',encoding='utf-8') as write_f: for line in read_f: write_f.write(line.replace('alex','dsb'))os.remove('a.txt')os.rename('.a.txt.swap','a.txt')
# 方式一:
# 优点: 在文件修改的过程中硬盘上始终一份数据# 缺点: 占用内存过多,不适用于大文件# 方式二:# 优点: 同一时刻在内存中只存在源文件的一行内容,不会过多地占用内存# 缺点: 在文件修改的过程中会出现源文件与临时文件共存,硬盘上同一时刻会有两份数据,即在修改的过程中会过多的占用硬盘,# 把列表写入到文件中
# 将列表转成字符,然后再写入到文件中
l=[1,2,3,'a','b','c','d']with open ("c.txt",'w+t',encoding='utf-8') as f: f.write(str(l))
c.txt
[1, 2, 3, 'a', 'b', 'c', 'd']