Java不能使用字符流读取非文本二进制文件的原因是什么

　　发布于2023-04-30　阅读（0）

扫一扫，手机访问

读取文件

刚学Java的IO流部分时，书上说只能使用字节流去读取图片、视频等非文本二进制文件，不能使用字符流，否则文件会损坏。所以我就一直记住这一点了，但是为什么不能使用，这一直是我的一个疑惑。今天，我又想到了这个问题，所以干脆就一鼓作气把它解决了吧。

先来看一个关于图片复制的代码示例： 注意：我的电脑是存在 D:/DB这个路径的，如果你没有，DB这个文件夹，必须建立一个。

package dragon;

import java.io.BufferedInputStream;
import java.io.BufferedOutputStream;
import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.FileWriter;
import java.io.IOException;
import java.io.InputStreamReader;
import java.nio.file.Path;
import java.nio.file.Paths;

public class ReadImage {
	public static void main(String[] args) throws IOException {
		String imgPath = "D:/DB/husky/kkk.jpeg";
		String byteImgCopyPath = "D:/DB/husky/byteCopykkk.jpeg";
		String charImgCopyPath = "D:/DB/husky/charCopykkk.jpeg";
		Path srcPath = Paths.get(imgPath);
		Path desPath2 = Paths.get(byteImgCopyPath);
		Path desPath3 = Paths.get(charImgCopyPath);
		
		byteRead(srcPath.toFile(), desPath2.toFile());
		System.out.println("字节复制执行成功！");
		
		characterRead(srcPath.toFile(), desPath3.toFile());
		System.out.println("字符复制执行成功！");
		
	}
	
	static void byteRead(File src, File des) throws IOException {
		try (BufferedInputStream bis = new BufferedInputStream(new FileInputStream(src));
				BufferedOutputStream bos = new BufferedOutputStream(new FileOutputStream(des))) {
			int hasRead = 0;
			byte[] b = new byte[1024];
			while ((hasRead = bis.read(b)) != -1) {
				bos.write(b, 0, hasRead);
			}
		}
	}
	
	static void characterRead(File src, File des) throws IOException {
		try (BufferedReader reader = new BufferedReader(new InputStreamReader(new FileInputStream(src), "UTF-8"));
				BufferedWriter writer = new BufferedWriter(new FileWriter(des))) {
			int hasRead = 0;
			char[] c = new char[1024];
			while ((hasRead = reader.read(c)) != -1) {
				writer.write(c, 0, hasRead);
			}
		}
	}
}

运行结果： 可见，使用字符流确实无法读取图片这样的二进制文件，必须使用字节流。

Java不能使用字符流读取非文本二进制文件的原因是什么

图片大小变化： 可见，使用字符流后图片大小变化了，使用字节流则不会。

Java不能使用字符流读取非文本二进制文件的原因是什么

为什么会这样呢？

通过上面那个例子，我们可以看到确实是无法使用字符流复制文件，并且使用字符流复制文件后，文件的大小也会变化，这就引出我们今天要讨论的标题了。

我们先来想一想，为什么文本文件打开可以显示文字？ 我们都知道计算机处理的文件无论是文本还是非文本的文件，最终在计算机内部都是以二进制的形式存储的。

使用文本编辑器的16进制模式打开一个文本文件：

Java不能使用字符流读取非文本二进制文件的原因是什么

使用编辑器的16进制模式打开上面程序使用的图片文件：

Java不能使用字符流读取非文本二进制文件的原因是什么

对比两张图片中的数据，应该发现不了什么区别吧，但是为什么文本数据就可以显示出文字呢？这是一个非常基础的问题，大学里面的基础课都是讲过这方面的内容–字符编码表。我最开始学习的是 C 语言，接触最早的编码表是 ASCII（美国信息交换标准代码），后来学习java接触的是 Unicode（万国码，这个名字和它的起源很契合。我们目前最常使用的是UTF-8，是针对Unicode的一种可变长度字符编码。）

注意： 使用 UTF-8 也是分为含有 BOM（Byte Order Mark，字节顺序标记）和没有的两种形式，而且混用会导致错误，感兴趣的可以去了解一下。

Java不能使用字符流读取非文本二进制文件的原因是什么

字符编码表的作用体现在编码上，引述百科的一段话：

在显示器上看见的文字、图片等信息在电脑里面其实并不是我们看见的样子，即使你知道所有信息都存储在硬盘里，把它拆开也看不见里面有任何东西，只有些盘片。假设，你用显微镜把盘片放大，会看见盘片表面凹凸不平，凸起的地方被磁化，凹的地方是没有被磁化；凸起的地方代表数字1，凹的地方代表数字0。硬盘只能用0和1来表示所有文字、图片等信息。那么字母”A”在硬盘上是如何存储的呢？可能小张计算机存储字母”A”是1100001，而小王存储字母”A”是11000010，这样双方交换信息时就会误解。比如小张把1100001发送给小王，小王并不认为1100001是字母”A”，可能认为这是字母”X”，于是小王在用记事本访问存储在硬盘上的1100001时，在屏幕上显示的就是字母”X”。也就是说，小张和小王使用了不同的编码表。

所以字符编码表就是二进制数字和字符之间的一个一一映射，例如 65 （数字）代表 A，所以下面这段代码会在屏幕上输出 A。

char c = 65;
System.out.println(c);

我们使用一个循环来测试一下：

char c = 0;
for (int i  = 9999; i < 10009; i++) {
	c = (char) i;
	System.out.print(c+" ");
}

测试结果：（当然了，这个取决于你的当前的字符编码表，如果使用 ASCII，估计就有意思了。）

Java不能使用字符流读取非文本二进制文件的原因是什么

这样就解释了前面那个问题（为什么文本文件打开可以显示文字？），我们之所以可以看见文本文件的字符是因为计算机按照我们文件的编码（ASCII、UTF-8或者GBK等），从字符编码表中找出来对应的字符。所以，当我们使用记事本打开二进制文件会看到乱码，这就是原因。文件的复制过程也是复制的二进制数据，而不是真实的文字。

因此可以这样理解文件复制的过程：

字符流：二进制数据 --编码-> 字符编码表 --解码-> 二进制数据
字节流：二进制数据 —> 二进制数据

所以问题就是出现在编码和解码的过程中，既然是字符的编码表，那它就是包含所有的字符，但是字符的数量是有限的，这就意味着它不能表示一些超过编码表的字符，因为根本不存在表中。所以，JVM 会使用一些字符进行替换，基本上都是乱码（所以大小会发生变化），而且如果有一个数据恰好是-1，那么读取就会中断，引起数据丢失。

例如如下代码使用字符流读取就会错误：

	String filename = "D:/DB/fos.txt";     //文件名
	byte[] b = new byte[] {-1, -1};      //两个字节，127的二进制就是 1111 1111
	//数据写入文件
	try (FileOutputStream fos = new FileOutputStream(filename)) {
		fos.write(b, 0, b.length);  //将两个127连续写入，就是 1111 1111 1111 1111
	}
	File file = new File(filename);
	//输出文件的大小
	System.out.println("file length: " + file.length());
	char[] c = new char[2];
	//使用字符流读取文件
	try (FileReader reader = new FileReader(filename)) {
		int count = reader.read(c);    //Java使用Unicode编码，读取的是从 0-65535 之间的数字。
		System.out.println("以文本形式输出：" + new String(c, 0, count)+"   "+count);
		for (char d : c) {  
			System.out.println("字符为：" + d);
		}
	}
	System.out.println("表示字符：" + c[0]);
	
	//再写入文件
	try (FileWriter writer = new FileWriter(filename)) {
		writer.write(c, 0, 2);
	}
	File f = new File(filename);
	System.out.println("file length: " + f.length());

结果：

Java不能使用字符流读取非文本二进制文件的原因是什么

说明： 我将两个1字节的-1写入（字节流）了文本文件（注意是字节：-1，不是字符：-1），然后再读取（字符流），再写入（字符流）就已经出现了问题。读取出的字符显示了一个奇怪的符号，而且它的值为：65533，这个值如果用字节表示的话，一个字节是不够的，所以文件的大小就会变化。在非文本的二进制数据中，出现这种情况都是正常的，因为本来就不是按照字符编码的。

因为字符都是正数，而非字符编码的话，字节数可能是负数(很可能)，但是负数在字符看来就是正数，这也是为什么－1，被读成 65533的原因。可以看出来，读取就已经错误了。

注意: 这里的重点是对于使用字符流读取非文本文件，在读取-写入的过程中的问题。

本文转载于：https://www.yisu.com/zixun/789048.html 如有侵犯，请联系admin@zhengruan.com删除

上一篇："Surface Laptop Studio 改进触摸板和语音清晰度，提升用户体验"

下一篇：java动态代理实例代码分析

产品推荐

售后无忧
立即购买>

DAEMON Tools Lite 10【序列号终身授权 + 中文版 + Win】

￥150.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Ultra 5【序列号终身授权 + 中文版 + Win】

￥198.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Pro 8【序列号终身授权 + 中文版 + Win】

￥189.00
office旗舰店
售后无忧
立即购买>

CorelDRAW X8 简体中文【标准版 + Win】

￥1788.00
office旗舰店

正版软件

正确在PHP Dompdf中渲染中文字符

如何在PHPDompdf中正确显示中文字符在使用PHPDompdf生成PDF文件时，遇到中文字符显示乱码的问题是一个常见的挑战。这是因为Dompdf默认使用的字体库中不包含中文字符集。为了正确显示中文字符，我们需要手动设置Dompdf的字体，并确保选择支持中文字符的字体。以下是一些具体的步骤和代码示例来解决这个问题：第一步：下载中文字体文件首先，我们需要

14分钟前中文 PHP DOMPDF 0
正版软件

开发手游的技术实现及挑战：Golang应用

Golang手游开发：技术实现与挑战近年来，随着智能手机的普及和移动互联网的发展，手游市场正在迅速增长。越来越多的开发者开始关注使用Golang语言进行手游开发，因为Golang具有高效、快速和可靠的特点，适合处理实时性较强的游戏逻辑。本文将探讨使用Golang进行手游开发的技术实现及所面临的挑战，并提供一些具体的代码示例。一、技术实现游戏引擎选择在使用Go

24分钟前 Golang 技术实现手游开发 0
正版软件

深入探讨PHP静态化技术

深入了解PHP静态化技术，需要具体代码示例随着互联网技术的不断发展，网站性能优化成为了开发人员和站长们关注的焦点之一。在优化网站性能的过程中，静态化技术备受推崇，其中PHP静态化技术被广泛应用。本文将深入探讨PHP静态化技术的原理及具体实现方法，并给出一些代码示例，帮助读者更好地理解和应用该技术。一、PHP静态化技术的原理PHP静态化技术是指将动态生成的页面

39分钟前技术 PHP 静态化 0
正版软件

PHP中静态方法与抽象方法的特性和用法深度剖析

PHP中静态方法与抽象方法的特性和用法在PHP编程中，静态方法和抽象方法是两种不同的方法类型，它们在面向对象编程中发挥着重要的作用。本文将探究PHP中静态方法与抽象方法的特性和用法，并提供具体的代码示例。一、静态方法的特性和用法静态方法的特性静态方法是指在类中定义的可以直接通过类名调用的方法，而不需要创建类的实例。其特点包括：可以通过类名直接调用，不需要实例

54分钟前 PHP 静态方法 PHP 抽象方法特性用法 0
正版软件

Golang的特色和优势，为何备受青睐？

Golang，即Go语言，是由Google开发的一种编程语言，它具有许多独特的特点和优势，因此成为了越来越热门的选择。本文将深入探讨Golang的特点与优势，以及为何它受到广泛欢迎，并提供具体的代码示例来说明这些特点。1.并发性Golang天生支持并发编程，其轻量级的协程（goroutine）机制使得并发编程更加简单高效。通过goroutine，可以很容易

1小时前 11:40 并发高效静态 0

Java不能使用字符流读取非文本二进制文件的原因是什么

读取文件

为什么会这样呢？

产品推荐

最新发布

相关推荐

热门关注