所谓文件一般是指存储在外部介质上的 数据集合 。一批数据是以 文件 的形式存放在外部介质的。操作系统是以文件为单位对数据进行管理的。
按数据的组织方式,数据文件可以分为有 结构文件 和 无结构文件 两类。
C语言使用的是 流式文件 。常见的 文本文件 和 二进制文件 属于流式文件。
ANSI C 标准 对文件的处理方法是 “缓冲文件系统” ,系统为每个打开文件在内存中开辟一个缓冲区。写文件时(从内存向磁盘输出数据),先送到缓冲区中,当缓冲区装满后才送到磁盘中去。读文件时,也经过缓冲区。这样做是为了提高读写效率,因为磁盘访问更耗时,一次读写一块数据, 比每次读写单个字符更经济。
缓冲文件系统中,关键的概念是 “文件指针” 。每个被用的文件都在内存中开辟一个区,用来存放文件的名字、状态、位置等有关信息,这些信息是保存在个结构体类型的变量中的。该结构体类型是由系统定义的,取名为FILE。有的C语言版本在stdio.h 文件中有以下类型定义。
有了FILE类型之后,可以用它定义若干个FILE结构体类型的变量,以便存放若干个文件信息。
称指向FILE结构体类型的变量为文件类型指针,称为文件指针。定义文件指针的一般形式:
FILE * 指针变量名;
通常把打开文件的FILE结构的首地址赋给文件指针。
在文件操作时,首先要打开文件,获得对该文件的指针。通过该指针,就可以获取对文件进行操作所需的信息。将该指针传递给相应的库函数,库函数就能通过这个信息,通过操作系统提供的文件系统调用,来完成低级且复杂的硬件操作,如磁盘的读与。
在C语言中,调用库函数fopen打开文件。该函数的调用方式通常为:
说明:
①函数的两个参数“文件名”和“使用文件方式”均为字符串,其中表示文件名的字符串可以包含文件的存储路径,否则表示文件存储在当前目录下。
②使用文件的方式及其含义如表8-1所示。
例如:
其意义是在当前目录下打开文件file1.txt,只允许进行“读”操作,并使fp指向file.txt。
其意义是在example目录下打开文件file2.txt,只允许进行“写”操作,并使fp指向file2.txt。
文件使用完毕,必须将其关闭以免发生文件数据丢失等错误。
关闭文件可调用库函数fclose来实现。
该函数的使用格式通常为:
fclose(文件指针)
说明:
将文件指针与文件脱离联系。如果成功进行关闭操作时,函数返回0,否则返回非0。
例如:
flose(fp)//关闭文件指针fp指向的文件
在C语言中用一个指针变量指向一个文件,这个指针称为文件指针。通过文件指针就可对它所指的文件进行各种操作。定义说明文件指针的一般形式为:
FILE *指针变量标识符
其中FILE应为大写,它实际上是由系统定义的一个结构,该结构中含有文件名、文件状态和文件当前位置等信息。在编写源程序时不必关心FILE结构的细节。例如:
FILE *fp
表示fp是指向FILE结构的指针变量,通过fp即可找存放某个文件信息的结构变量,然后按结构变量提供的信息找到该文件,实施对文件的操作。习惯上也笼统地把fp称为指向一个文件的指针。
文件在进行读写操作之前要先打开,使用完毕要关闭。所谓打开文件,实际上是建立文件的各种有关信息,并使文件指针指向该文件,以便进行其它操作。关闭文件则断开指针与文件之间的联系,也就禁止再对该文件进行操作。
在C语言中,文件操作都是由库函数来完成的。在本章内将介绍主要的文件操作函数。
文件的打开(fopen函数)
fopen函数用来打开一个文件,其调用的一般形式为:
文件指针名 = fopen( 文件名, 使用文件方式 )
其中:
“文件指针名”必须是被说明为FILE 类型的指针变量;
“文件名”是被打开文件的文件名;
“使用文件方式”是指文件的类型和操作要求;
“文件名”是字符串常量或字符串数组。
例如:
FILE *fp
fp=("file a","r")
其意义是在当前目录下打开文件file a,只允许进行“读”操作,并使fp指向该文件。又如:
FILE *fphzk
fphzk=("c:\\hzk16","rb")
其意义是打开C驱动器磁盘的根目录下的文件hzk16,这是一个二进制文件,只允许按二进制方式进行读操作。两个反斜线“\\ ”中的第一个表示转义字符,第二个表示根目录。
使用文件的方式共有12种,下面给出了它们的符号和意义。
文件使用方式
意义
rt只读打开一个文本文件,只允许读数据
wt只写打开或建立一个文本文件,只允许写数据
at追加打开一个文本文件,并在文件末尾写数据
rb只读打开一个二进制文件,只允许读数据
wb只写打开或建立一个二进制文件,只允许写数据
ab追加打开一个二进制文件,并在文件末尾写数据
rt+读写打开一个文本文件,允许读和写
wt+读写打开或建立一个文本文件,允许读写
at+读写打开一个文本文件,允许读,或在文件末追加数据
rb+读写打开一个二进制文件,允许读和写
wb+读写打开或建立一个二进制文件,允许读和写
ab+读写打开一个二进制文件,允许读,或在文件末追加数据
对于文件使用方式有以下几点说明。
1) 文件使用方式由r、w、a、t、b 和 + 六个字符拼成,各字符的含义是:
r(read):读
w(write):写
a(append):追加
t(text):文本文件,可省略不写
b(banary):二进制文件
+:读和写
2) 凡用“r”打开一个文件时,该文件必须已经存在,且只能从该文件读出。
3) 用“w”打开的文件只能向该文件写入。若打开的文件不存在,则以指定的文件名建立该文件,若打开的文件已经存在,则将该文件删去,重建一个新文件。
4) 若要向一个已存在的文件追加新的信息,只能用“a”方式打开文件。但此时该文件必须是存在的,否则将会出错。
5) 在打开一个文件时,如果出错,fopen将返回一个空指针值NULL。在程序中可以用这一信息来判别是否完成打开文件的工作,并作相应的处理。因此常用以下程序段打开文件:
if((fp=fopen("c:\\hzk16","rb")==NULL){
printf("\nerror on open c:\\hzk16 file!")
getch()
exit(1)
}
这段程序的意义是,如果返回的指针为空,表示不能打开C盘根目录下的hzk16文件,则给出提示信息“error on open c:\ hzk16 file!”,下一行getch()的功能是从键盘输入一个字符,但不在屏幕上显示。在这里,该行的作用是等待,只有当用户从键盘敲任一键时,程序才继续执行,因此用户可利用这个等待时间阅读出错提示。敲键后执行exit(1)退出程序。
6) 把一个文本文件读入内存时,要将ASCII码转换成二进制码,而把文件以文本方式写入磁盘时,也要把二进制码转换成ASCII码,因此文本文件的读写要花费较多的转换时间。对二进制文件的读写不存在这种转换。
7) 标准输入文件(键盘),标准输出文件(显示器),标准出错输出(出错信息)是由系统打开的,可直接使用。
文件关闭函数(fclose函数)
文件一旦使用完毕,应用关闭文件函数把文件关闭,以避免文件的数据丢失等错误。
fclose函数调用的一般形式是:
fclose(文件指针)
例如:
fclose(fp)
正常完成关闭文件操作时,fclose函数返回值为0。如返回非零值则表示有错误发生。
当使用完一个文件后,应该将该文件关闭,以防止它再被调用。“关闭”就是是文件指针变量不再指向该文件,也就是文件指针变量与该文件“断开”,此后不能通过该指针变量对原来与其相联系的文件进行读写操作,除非再次打开,使文件变量重新指向该文件。【调用形式】fclose(文件指针变量名)
【功能】关闭文件指针变量所指向的文件,同时自动释放分配给文件的缓冲区。
【返回值】文件能正常关闭,则返回0,否则返回非0.