java FileInputStream(输入流)

时间:2022-09-28 李昕羽人气:0

一、File流概念

JAVA中针对文件的读写操作设置了一系列的流，其中主要有FileInputStream,FileOutputStream,FileReader,FileWriter四种最为常用的流

二、FileInputStream

1. FileInputStream概念

FileInputStream流被称为文件字节输入流，意思指对文件数据以字节的形式进行读取操作如读取图片视频等

2. 构造方法

2.1 通过打开与File类对象代表的实际文件的链接来创建FileInputStream流对象

public FileInputStream(File file) throws FileNotFoundException{}

若File类对象的所代表的文件不存在;不是文件是目录;或者其他原因不能打开的话，则会抛出FileNotFoundException

 /**
     * 
     * 运行会产生异常并被扑捉--因为不存在xxxxxxxx这样的文件
     */
public static void main(String[] args)
    {
        File file=new File("xxxxxxxx"); //根据路径创建File类对象--这里路径即使错误也不会报错，因为只是产生File对象，还并未与计算机文件读写有关联
        
        try
        {
            FileInputStream fileInputStream=new FileInputStream(file);//与根据File类对象的所代表的实际文件建立链接创建fileInputStream对象
        }
        catch (FileNotFoundException e)
        {
          
           System.out.println("文件不存在或者文件不可读或者文件是目录");
        } 
    }

2.2 通过指定的字符串参数（路径）来创建File类对象，而后再与File对象所代表的实际路径建立链接创建FileInputStream流对象

   public FileInputStream(String name) throws FileNotFoundException {
        this(name != null ? new File(name) : null);
    }

该方法实际调用的还是上面那个方法。

3. 相关方法

3.1 public int read() throws IOException

官方文档

public int read() throws IOException
从此输入流中读取一个数据字节。如果没有输入可用，则此方法将阻塞。
指定者：
类 InputStream 中的 read
返回：
下一个数据字节；如果已到达文件末尾，则返回 -1。

理解读取的字节为什么返回int型变量

从输入流中读取一个字节返回int型变量，若到达文件末尾，则返回-1
我们读取的字节实际是由8位二进制组成，二进制文件不利于直观查看，可以转成常用的十进制进行展示，因此需要把读取的字节从二进制转成十进制整数，故返回int型。
如果当文件未到底时，我们读取的是字节，若返回byte类型，那么势必造成同一方法返回类型不同的情况这是不允许的
既然说可以测试任意形式的文件，那么用两种不同格式的，测试文件data1.txt和data2.txt，里面均放入1个数字"1"，两文件的格式分别为：ANSI和Unicode。

我们用如下代码测试

import java.io.FileInputStream;
import java.io.IOException;
public class Test {
    public static void main(String[] args) throws IOException {
       
     FileInputStream fis = new FileInputStream("data1.txt");//ANSI格式
     for (int i = 0; i < 5; i++) {
         System.out.println(fis.read());    
     }
     
     fis.close();    
     System.out.println("------------------");
     fis = new FileInputStream("data2.txt");//Unicode格式
     for (int i = 0; i < 5; i++) {
         System.out.println(fis.read());    
     }
     fis.close();
    }
}

文件里不是只有一个数字吗，为什么循环5次，什么鬼？稍后知晓，先看输出结果：

49
-1
-1
-1
-1
------------------
255
254
49
0
-1

结果怎么会是这样呢？

1.因为ANSI编码没有文件头,因此数字字符1只占一个字节,并且1的Ascii码为49因此输出49,而Unicode格式有2个字节的文件头，并且以2个字节表示一个字符,对于Ascii字符对应的字符则是第2位补0,因此1的Unicode码的两位十进制分别为49和0;

附:文本文件各格式文件头:ANSI类型:什么都没有,UTF-8类型：EF BB BF,UNICODE类型:FF FE,UNICODE BIG ENDIAN类型:FE FF

2.从返回的结果来看，返回的是当前的字节数据，API文档中原文为:“下一个数据字节，如果已到达文件末尾，则返回 -1。”(英文原文为:the next byte of data, or -1 if the end of the file is reached)，应该理解成:此时的指针在下一个数据字节的开始位置。

3.2 read （byte[ ] b ）

官方文档

public int read(byte[] b) throws IOException
从此输入流中将最多 b.length 个字节的数据读入一个 byte 数组中。在某些输入可用之前，此方法将阻塞。
覆盖：
类 InputStream 中的 read
参数：
b - 存储读取数据的缓冲区。
返回：
读入缓冲区的字节总数，如果因为已经到达文件末尾而没有更多的数据，则返回 -1。

解读：

最多b.length个字节的数据读入一个byte数据组中，即，最多将byte数组b填满;
返回读入缓冲的字节总数，如果因为已经到达文件末尾而没有更多的数据，则返回-1。这里即这为朋友的问题点，为什么用-1来判断文件的结束。他的理由为,假设3个字节源数据，用2个字节的数组来缓存，当第2次读取的时候到达了文件的结尾，此时应该返回-1了,岂不是只读取到了2个字节？

同样，我们来测试：

测试文件，data.txt,文件格式ANSI,文件内容123,测试代码：

import java.io.FileInputStream;
import java.io.IOException;
import java.util.Arrays;
public class Test {
    public static void main(String[] args) throws IOException {
     FileInputStream fis = new FileInputStream("data.txt");//ANSI格式
     byte[] b = new byte[2];
     for (int i = 0; i < 3; i++) {
         System.out.print("第"+(i+1)+"次读取返回的结果:"+fis.read(b));
         System.out.println(",读取后数组b的内容为:"+Arrays.toString(b));
    }
     fis.close();
    }
}

输出结果：

第1次读取返回的结果:2,读取后数组b的内容为:[49, 50]
第2次读取返回的结果:1,读取后数组b的内容为:[51, 50]
第3次读取返回的结果:-1,读取后数组b的内容为:[51, 50]

测试数据文件采用的是ANSI格式，放入3个数字，因此为3个字节，这里测试读3次，从代码中可以看出，b为一个byte数组,大小为2，即每次可以存放2个字节。那么问题来了，第一次读取的时候读到2个字节返回很好理解，而第2次的时候,由于只剩下一个字节，此处到了文件的结尾，按照朋友对API文档的理解,应该返回-1才对？

让我们看看源码吧

 public int read(byte b[]) throws IOException {
    return readBytes(b, 0, b.length);
 }

private native int readBytes(byte b[], int off, int len) throws IOException;

晴天霹雳，是个被native修饰的方法,因此没办法继续一步看代码了。没啥好说的，用个代码类继承FileInputStream,覆盖read(byte b)方法，看代码即能理解：

import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
public class MyFileInputStream extends FileInputStream{
    public MyFileInputStream(String name) throws FileNotFoundException {
        super(name);
    }
    @Override
    public int read(byte[] b) throws IOException {
        int getData = read();
        if (getData==-1) {
            return -1;
        }else{
            b[0] = (byte)getData;
            for (int i = 1; i < b.length; i++) {
                getData = read();
                if(-1==getData)
                    return i;
                b[i] = (byte)getData;
            }
        }
        return b.length;
    }
}

原测试代码做小小的改动：

import java.io.FileInputStream;
import java.util.Arrays;
public class Test {
    public static void main(String[] args) throws Exception {
        FileInputStream fis = new MyFileInputStream("data.txt");//ANSI格式
         byte[] b = new byte[2];
         for (int i = 0; i < 3; i++) {
             System.out.print("第"+(i+1)+"次读取返回的结果:"+fis.read(b));
             System.out.println(",读取后数组b的内容为:"+Arrays.toString(b));
        }
         fis.close();
        }
}

输出结果与原结果一致：

第1次读取返回的结果:2,读取后数组b的内容为:[49, 50]
第2次读取返回的结果:1,读取后数组b的内容为:[51, 50]
第3次读取返回的结果:-1,读取后数组b的内容为:[51, 50]

说明此方法内部调用的是read（）方法一个个的来读数据。如果第一个字节不是 -1 就会继续读，如果后续的read（）返回的是-1 那么此方法就不会返回 - 1 返回的是i。

正确显示文本内容

import java.io.FileInputStream;
public class Test {
    public static void main(String[] args) throws Exception {
        FileInputStream fis = new MyFileInputStream("data.txt");//ANSI格式
         byte[] b = new byte[2];
         int len ;
         while (-1!=(len = fis.read(b))) {
             System.out.println(new String(b,0,len));
        }
         
         fis.close();
     }
}

3.3 available()方法

public int available();

方法的返回类型为int，它返回在解除阻塞期间可以从此FileInputStream读取的剩余可用字节数。

以上为个人经验，希望能给大家一个参考，也希望大家多多支持。

加载全部内容