C语言进阶——文件操作
一、文件的基本知识
1.1什么是文件
在程序设计中,一般谈的文件有两种:程序文件、数据文件。
- 程序文件:包括源程序文件(后缀为.c),目标文件(windows环境后缀为.obj),可执行程序(windows环境后缀为.exe)。
- 数据文件:文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,或者输出内容的文件。
之前的博客处理的数据的输入输出都是以终端为对象的,从终端的键盘输入数据,运行结构显示到显示器上。实际上,有时候我们会把信息输出到磁盘上,当需要的时候再从磁盘上把数据读取到内存中使用。
1.2文件名
一个文件需要有一个唯一的标识符,以便用户识别和引用。文件名包括三部分:文件路径+文件名主干+文件后缀。为了方便起见,文件标识常被称为文件名。
1.3文件类型
根据数据的组织形式,数据文件被称为文本文件或者二进制文件。
数据在内存中以二进制的形式存储,如果不加转换的输出到外存,就是二进制文件。
如果要求在外存中以ASCII码的形式出现,则需要在存储前转换。以ASCII码形式存储的文件就是文本文件。
字符一律以ASCII码形式存储,数值型数据既可以ASCII形式,也可以二进制形式。
二、文件处理
2.1文件缓冲区
ANSIC 标准采用“缓冲文件系统”处理的数据文件的,所谓缓冲文件系统是指系统自动地在内存中为程序中每一个正在使用的文件开辟一块“文件缓冲区”。从内存向磁盘输出数据会先送到内存中的缓冲区,装满缓冲区后才一起送到磁盘上。如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓冲区(充满缓冲区),然后再从缓冲区逐 个地将数据送到程序数据区(程序变量等)。
2.2文件指针
缓冲文件系统中,关键的概念是“文件指针类型”,简称“文件指针”。
每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名字、文件状态以及文件当前的位置等)。这些信息是保存在一个结构体变量中。
struct _iobuf {char *_ptr;int _cnt;char *_base;int _flag;int _file;int _charbuf;int _bufsiz;char *_tmpfname;};
typedef struct _iobuf FILE;
不同的编译器中的FILE类型包含的内容不完全一样,但是大同小异。
每当打开一个文件时,系统会自动创建一个FILE结构的变量,并填充其中的信息,使用者不必关心细节。
通常通过一个FILE的指针来维护这个变量。
FILE* pf;//文件指针变量
定义pf是一个指向FILE类型数据的指针变量,可以使pf指向某个文件的文件信息区。通过该文加信息区中的信息就就能够访问该文件。也就是说,通过文件的指针变量能够找到与它相关的文件。
三、文件的使用
3.1文件的打开和关闭
文件在读写之前,应该先打开文件,在使用结束之后应该关闭文件。在编写程序的时候,在打开文件的同时,都会返回一个FILE*类型的指针变量指向该文件,也相当于建立了指针和文件的关系。
FILE* fopen(const char* filename,const char *mode);
int fcolse(FILE * stream);
mode参数代表了文件的打开方式:
文件使用方式 | 含义 | 如果指定文件不存在 |
"f"(只读) | 为了输入数据打开一个已经存在的文本文件 | 出错 |
"w" | 为了输出数据打开一个的文本文件 | 建立一个新的文件 |
"a" | 向文本文件尾部添加数据 | 出错 |
"rb" | 为了输入数据打开一个的二进制文件 | 出错 |
"wb" | 为了输出数据打开一个的二进制文件 | 建立一个新的文件 |
"ab" | 向二进制文件尾部添加数据 | 出错 |
"r+" | 为了读和写,打开一个文本文件 | 出错 |
"w+" | 为了读和写,建立一个文本文件 | 建立一个新的文件 |
"a+" | 打开一个文件,在文件尾进行续写 | 建立一个新的文件 |
"rb+" | 为了读和写,打开一个二进制文件 | 出错 |
"wb+" | 为了读和写,新建一个二进制文件 | 建立一个新的文件 |
"ab+" | 打开一个二进制文件,在文件尾进行续写 | 建立一个新的文件 |
3.2文件的顺序读写
功能 | 函数名 | 适用于 |
字符输入函数 | fgetc | 所有输入流 |
字符输出函数 | fputc | 所有输出流 |
文本行输入函数 | fgets | 所有输入流 |
文本行输出函数 | fputs | 所有输出流 |
格式化输入函数 | fscanf | 所有输入流 |
格式化输出函数 | fprintf | 所有输出流 |
二进制输入 | fread | 文件 |
二进制输出 | fwrite | 文件 |
- scanf:从标准输入流读取格式化的数据。
- printf:从标准输出流写格式化的数据。
- fscanf:适用于所有输入流的格式化输入函数。
- fprintf:适用于所有输出流的格式化输出函数。
- sscanf:从字符串中读取格式化的数据。
- sprintf:将格式化的数据,转换成字符串。
int scanf ( const char * format, ... );
int fscanf ( FILE * stream, const char * format, ... );
int sscanf ( const char * s, const char * format, ...);
int printf ( const char * format, ... );
int fprintf ( FILE * stream, const char * format, ... );
int sprintf ( char * str, const char * format, ... );
3.3文件的随机读写
fseek
根据文件指针的位置和偏移量来定位文件指针
int fseek(FILE*stream, long int offset, int origin);
origin参数决定了定位文件指针的起始位置。
#include<stdio.h>
int main()
{FILE *pflie;pfile = fopen("example.txt","wb");if(pfilw == NULL){perror("fopen");return1;}fputs("This is an example.",pfile);fseek(pfile,9,seek_set);fputs("sam",pfile);fclose(fpile);return 0;
}
ftell
返回文件指针相对于起始位置的偏移量。
long int ftell ( FILE * stream );
/* ftell example : getting size of a file */
#include <stdio.h>
int main()
{FILE* pFile;long size;pFile = fopen("myfile.txt", "rb");if (pFile == NULL) perror("Error opening file");else{fseek(pFile, 0, SEEK_END); size = ftell(pFile);fclose(pFile);printf("Size of myfile.txt: %ld bytes.\n", size);}return 0;
}
rewind
让文件指针回到文件的起始位置。
void rewind(FILE* stream);
/* rewind example */
#include <stdio.h>
int main()
{int n;FILE* pFile;char buffer[27];pFile = fopen("myfile.txt", "w+");for (n = 'A'; n <= 'Z'; n++)fputc(n, pFile);rewind(pFile);fread(buffer, 1, 26, pFile);fclose(pFile);buffer[26] = '\0';puts(buffer);return 0;
}
3.4文件结束判定
feof函数作用是文件读取结束时,判断读取结束的原因是否是:遇到文件末尾,是用来分析文件结束原因的,而非用来判断文件是否结束。
- 文本文件的读取是否结束,判断返回值是不是EOF或者NULL。
- 二进制文件的读取结束,应该判断返回值是否小于实际要读的个数。
文本文件的例子:
#include <stdio.h>
#include <stdlib.h>
int main(void)
{int c; // 注意:int,非char,要求处理EOFFILE* fp = fopen("test.txt", "r");if (!fp) {perror("File opening failed");return EXIT_FAILURE;}//fgetc 当读取失败的时候或者遇到文件结束的时候,都会返回EOFwhile ((c = fgetc(fp)) != EOF) // 标准C I/O读取文件循环{putchar(c);}//判断是什么原因结束的if (ferror(fp))puts("I/O error when reading");else if (feof(fp))puts("End of file reached successfully");fclose(fp);
}
二进制文件的例子:
#include <stdio.h>
enum { SIZE = 5 };
int main(void)
{double a[SIZE] = { 1.0,2.0,3.0,4.0,5.0 };double b = 0.0;size_t ret_code = 0;FILE* fp = fopen("test.bin", "wb"); // 必须用二进制模式fwrite(a, sizeof(*a), SIZE, fp); // 写 double 的数组fclose(fp);fp = fopen("test.bin", "rb");// 读 double 的数组while ((ret_code = fread(&b, sizeof(double), 1, fp)) >= 1){printf("%lf\n", b);}if (feof(fp))printf("Error reading test.bin: unexpected end of file\n");else if (ferror(fp)) {perror("Error reading test.bin");}fclose(fp);fp = NULL;
}