当前位置：首页 > news >正文

文件操作和IO

news 2025/9/11 5:39:05

一. 文件预备知识

1. 硬盘

2. 文件

(1) 概念

(2) 文件路径

(3) 文件类型

二. 文件操作

1. 文件系统操作

[1] File常见的构造方法

[2] File的常用方法

2. 文件内容操作

(1) 打开文件

(2) 关闭文件

(3) 读文件

(4) 写文件

一. 文件预备知识

1. 硬盘

上一个要点中提到, 文件指的是计算机硬盘中存储的文件及目录. 那么硬盘是什么呢? 它有什么特点?

(1) 概念: 硬盘是计算机中用来存储数据的设备. 硬盘包括机械硬盘和固态硬盘. 机械硬盘读写速度较慢, 在特定场景下读写速度较快(顺序读写), 成本相对较低; 固态硬盘读写速度快(尤其是随机读写), 成本相对较高.

(2) 硬盘和内存的区别: 硬盘存储空间大, 内存存储空间小; 硬盘读写速度快, 内存读写速度慢; 硬盘能持久存储数据, 内存在断电后数据丢失; 硬盘成本较低, 内存成本较高.

2. 文件

(1) 概念

狭义上的文件: 指的是计算机硬盘上存储的文件及保存文件的目录.

广义上的文件: 计算机中的很多硬件设备, 软件资源, 在操作系统中, 都会被统称为"文件". (比如输入用的键盘, 输出用的控制台, 还有打印机, 网卡等这些软硬件资源都属于"文件").

[注]: 我们在文件操作中讨论的是 "狭义上的文件".

(2) 文件路径

绝对路径: 从盘符(或根目录)开始, 一直到文件名结束, 表示某个文件完整的存储路径.

eg:

D:\Java_Wang\proj_BInaryTree\src 这个路径就表示文件src在计算机中的完整存储路径.

相对路径: 从当前目录开始, 去表示某一文件的存储路径. ( "." 表示当前目录, ".." 表示上一级目录)

eg: 我们以D:\Java_Wang\proj_BInaryTree这个路径为当前目录, 那么src文件的相对路径就是: .\src

如果以D:\Java_Wang\proj_BInaryTree\src 为当前目录去表示out文件的相对路径, 那就应该表示为: ..\out (因为src的上一级目录是proj_BinaryTree)

[注]: 一般Windows系统中的文件分隔符是" \ "(反斜杠) , Linux系统的文件分隔符是" / "(斜杠). 但是Windows为了兼容Linux的用户, 同时支持" \ "和" / " , 但是, 需要注意的是, 写反斜杠的时候, 只写一个反斜杠" \ ", 表示转义字符; 写两个反斜杠" \\ "才表示反斜杠.

(3) 文件类型

文本文件: 文本文件以字符的形式存储数据, 文件中存放的所有的二进制数据都能通过码表对应到正确的字符. (一般可以用文本编辑器打开查看)
二进制文件: 二进制文件以二进制的形式存储数据, 文件中存放的二进制数据并非所有都能通过码表对应到字符. (一般用文本编辑器打开是乱码)

[注]: 文本文件和二进制文件在内存中都是以二进制 (0/1) 的形式存储的. 区别主要在于文本文件所有数据都能通过码表对应正确的字符, 对人类可读. 而二进制文件通过码表对应出来的字符是不可读的(乱码).

我们可以举个例子看看:

通过文本编辑器打开文本文件:

文本文件打开之后是正常的, 可读的文字.

通过文本编辑器打开二进制文件:

二进制文件打开之后是一大堆不可读的乱码.

二. 文件操作

1. 文件系统操作

文件系统操作主要包括: 创建文件, 删除文件, 创建目录, 删除目录, 重命名文件, 判定文件是否存在等.

java中, 提供了File类 (这个类封装了系统对于文件操作的API), 来帮助我们完成文件系统操作. File这个类会将某个路径包装成一个对象, 后续对这个路径的操作全是基于这个对象进行的. ([注]: 这个路径可以存, 在也可以不存在).

[1] File的构造方法

[1] File常见的构造方法

(1) File(File parent, String child) --> 两个参数, 根据父目录对象和孩子文件的路路径创建一个File对象.

(2) File(String pathname) --> 一个参数, 根据文件路径创建一个File对象. (常用)

(3) File(String parent, String child) --> 两个参数, 根据父目录的路径和孩子文件的路径创建一个File对象.

[2] File的常用方法

关于对File的操作, java标准库提供了很多方法, 大家可以自行查看, 我们这里挑几个常用的方法讨论一下.

(1) getParent() : 返回值为String类型, 返回File对象的父目录的路径.

(2) getName() : 返回值为String类型, 返回File对象的文件名称.

(3) getPath() : 返回值为String类型, 返回文件的路径.

(4) getAbsolutePath() : 返回值为String类型, 返回文件的绝对路径.

(5) getCanonicalPath() : 返回值为String类型, 返回文件经过修饰的绝对路径.

下面我们通过代码演示一下上述几个方法:

import java.io.File;
import java.io.IOException;public class Demo1 {public static void main(String[] args) throws IOException {File file = new File(".\\test.txt"); //创建一个文件对象//注意: 这里写了一个相对路径, 这个相对路径的基准路径是当前项目所在的路径System.out.println(file.getParent()); //获取当前文件对象的父目录System.out.println(file.getName()); //获取当前文件名字System.out.println(file.getPath()); //获取当前文件的路径System.out.println(file.getAbsolutePath()); //获取当前文件的绝对路径System.out.println(file.getCanonicalPath()); //获取当前文件经过修饰的绝对路径}
}

我们这里声明了IOException, 我们咋进行文件操作的时候, 很可能会抛出异常, 主要原因有两点: 一是由于权限不够, 二是由于硬盘存储空间已满.

我们创建文件对象的时候, 给的路径是一个相对路径. 我们前面说过, 相对路径一定有一个基准路径, 这里test.txt文件的基准路径(当前目录)就是该项目所在目录. 那么该项目所在目录的路径是什么呢? 我们可以通过project --> Open in Explorer 来查看.

下面我们看这个程序的打印结果:

父目录的路径: 父目录的路径就是当前路径, 就是一个 "."

文件名称: 文件名称就是test.txt

路径: 这里文件路径用相对路径表示.

文件的绝对路径: 显示文件的绝对路径 (注意这里的绝对路径没有删除 ".")

文件经过修饰后的绝对路径: 这里显示的绝对路径就是我们平时看到的绝对路径了. 修饰就相当于把 "." 删除掉了.

(6) createNewFile() : 返回值为boolean类型, 创建File对象代表的文件, 如果创建成功, 返回true.

我们看到, 这里成功在当前目录下创建了一个文件test.txt. 打印true. 我们在左侧项目列表中能看到, 多出了一个test.txt文件.

(7) delete() : 返回值为boolean类型, 删除文件, 如果删除成功, 则返回true.

(8) deleteOnExit() : 没有返回值, 表示在进程结束时删除文件.

我们调用了deleteOnExit(), 表示在进程结束时删除该文件, 如上述运行结果,在先打印了两个"wait for Exit" 之后, 进程结束, 同时删除文件, 我们可以看到在同一时刻左侧项目列表中看到test.txt消失.

(9) mkdir() : 返回值为boolean类型, 创建File对象代表的目录 ([注]: 这里只能创建一级目录), 创建成功则返回true

如上述代码, 我们调用mkdir()方法, 并打印其返回值, 运行结果是true, 并且可以在左侧项目列表中看到出现了一个新的目录名为test.txt.

(10) mkdirs() : 返回值为boolean类型, 创建File对象代表的目录 (可以是多级目录), 创建成功则返回true.

如上述代码, 我们创建了多级目录.

(11) isFile() : 返回值为boolean类型, 判断当前File对象代表的文件是否是一个普通文件.

(12) isDirectory() : 返回值为boolean类型, 判断当前File对象代表的文件是否是一个目录.

调用isFile()和isDirectory()判断test.txt的文件类型. 显然, text是一个普通文件, 不合是一个目录. 所以打印 true, false.

(13) list() : 返回值为String[]类型, 返回一个字符串数组. 返回File对象代表的目录下所有的文件的名称.

运行代码, 我们发现, 如果我们直接打印 list() 的结果, 得到的是一串哈希码, 但这显然不是我们想要的. 所以, 我们如果想得到所有文件的名称, 还需要一步处理: Arrays.toString().

这样一来就得到了我们想要的文件名称了.

(14) listFiles() : 返回值为File[], 返回一个File类型的数组. 返回File对象代表的目录下所有的文件对象.

listFiles()方法能够获取所有文件对象, 而list()方法只能获取文件名称, 所以我们日常开发中, 使用listFiles() 会更多一点.

(15) renameTo(File dest) : 返回值为boolean类型, 进行文件改名操作.

我们先创建出一个名称为"aaa"文件.

下一步调用renameTo方法将文件aaa的名称改为bbb.

通过list()和listFiles(), 我们只能查看到当前目录下面一层的文件. 但是如果我们想要获取到当前目录下面所有的目录和文呢? --> 通过递归的方法实现.

import java.io.File;public class Demo4 {private static void scan(File currentDir) {File[] files = currentDir.listFiles(); // 1. 获取该目录下所有的文件if (files == null || files.length == 0 ) {return;// 2. 如果目录为空 / 给定路径不是目录 --> 直接返回.}System.out.println(currentDir.getAbsolutePath());// 3. 打印目录的路径for (File f : files) {// 4. 遍历当前目录下所有的内容.if (f.isFile()) {// 如果是普通文件, 直接打印其路径System.out.println(f.getAbsolutePath());} else {// 如果是目录(不是普通文件), 那就递归调用scan方法.scan(f);}}}public static void main(String[] args) {File f = new File(".");scan(f);}
}

如上述运行结果, 这里就打印出了当前目录下所有的目录(+其中的文件) 和文件.

2. 文件内容操作

文件内容的操作, 无非两种, 读文件和写文件. 对于读文件和写文件的操作, 系统也有相应的API, 并且 java 也对这些 API 进行了封装, 叫做 "文件流" 或者 "IO流". (流: Stream).

为什么叫流呢? 因为它的读写方式是流式的. 什么是流式? --> 我们可以结合水流来理解一下: 比如我接水的时候, 要接100ml的水, 那么我可以一次接100ml全接完, 也可以一次接50ml分两次接完, 也可以一次接10ml分10次接完, 也可以第一次接1ml, 第二次接2ml, 第三次接3ml, ... 直到接完100ml. 类似地, IO流在读数据的时候, 要读100byte的数据, 可以一次把100byte全读完, 也可用一次读取50byte, 分两次读完, 也可以一次读10byte, 分10次读完, 也可以第一次读1byte, 第二次读2byte, 第三次读3byte, ... 直到读完100byte.

上述这样的读写方式, 我们就成为是"流式"的.

Java中实现IO流的类有很多, 我们把它们分成两大类: 字符流(用于读写文本文件) 和字节流(用于读写二进制文件). 字符流是以字符为读写的基本单位; 字节流是以字节为读写的基本单位.

字节流又分为字节输入流(InputStream) 和字节输出流(OutputStream).

字符流又分为字符输入流(Reader) 和字符输出流(Writer).

上面说的这4个类, 都是抽象类, Java中又提供了很多很多类实现了这4个抽象类.

其中, 以 InputStream, OutputStream 结尾的, 就是实现了 InputStream, OutputStream 的类. 以Reader, Writer 结尾的, 就是实现了 Reader, Writer 的类.

这么多类, 我们当然不需要全部掌握, 我们只需要掌握其中几个重点的类即可, 其他的在以后如果有用到再查.

[注]: 什么是"输入", 什么是"输出"? --> 我们一般站在CPU的角度讨论这个问题: 数据远离CPU是输出, 数据靠近CPU是输入.

InputStream

如上述代码, 我们创建了一个字节流对象, 由于InputStream是抽象类, 不能直接用它创建对象, 所以我们使用它的实现类FileInputStream来创建对象. 这里抛出的FileNotFoundException是IOException的子类. (所以在这里我们直接写IOException也是没有问题的).

注意: 这里FileInputStream类构造方法中传的参数就是我们要进行读写的目标文件, 这个参数可以是绝对路径, 可以是相对路径, 还可以是File对象.

上述代码的含义: 创建了一个字节流对象, 并且打开指定目录的文件(此处并不能直接看出来, 但是这样的代码确实隐含了这样的操作).

注意, 在这里我们使用完字节流对象之后, 记得要释放资源.

关于这里为什么要释放资源, 我们来具体解释一下: 我们先需要知道, 系统中有一个文件描述符表, 它本质上是一个长度固定, 不可扩容的数组, 如果我们打开一个文件, 就相当于在文件描述符表上插入了一个元素(占用了一个位置), 只有调用close(), 才能把这个占用的空间释放出来, 如果我们不去调用close(), 那么这个位置就会被持续占用, 如果我们一直打开文件, 一直不关闭, 那么用不了多久这个文件描述符表就会被占满, 到那时候我们再打开文件, 就会出现错误! --> 这个问题就被称为"文件资源泄漏"问题. 所以, 我们在打开文件之后, 一定记得要关闭, 避免出现这样的问题.