Java控制台读取带重音字符（如èéëê）失败的根本原因与解决方案是什么

来源：站长工具作者：IT小魔仙头衔：程序员

导读：本期聚焦于小伙伴创作的《Java控制台读取带重音字符（如èéëê）失败的根本原因与解决方案是什么》，敬请观看详情，探索知识的价值。以下视频、文章将为您系统阐述其核心内容与价值。如果您觉得《Java控制台读取带重音字符（如èéëê）失败的根本原因与解决方案是什么》有用，将其分享出去将是对创作者最好的鼓励。

Java控制台读取带重音字符失败是典型的字符编码不匹配问题，核心原因和JVM默认编码、系统控制台编码、输入流转换逻辑三个环节有关，重音字符属于非ASCII字符，对编码一致性要求更高，任何环节的编码偏差都会导致解析错误。

问题复现示例

我们先来看一段常见的控制台读取代码，在Windows系统默认编码为GBK的环境下，输入èéëê字符会出现乱码：

import java.util.Scanner;

public class ConsoleReadDemo {
    public static void main(String[] args) {
        Scanner scanner = new Scanner(System.in);
        System.out.println("请输入带重音的字符：");
        String input = scanner.nextLine();
        System.out.println("你输入的内容是：" + input);
    }
}

运行后输入èéëê，输出结果会显示为乱码，比如变成问号或者其他无法识别的字符。

根本原因拆解

1. JVM默认编码与系统控制台编码不匹配

Java的System.in默认使用的是JVM启动时的默认编码，而不同操作系统的控制台编码存在差异：Windows系统控制台默认编码多为GBK，Linux和macOS终端默认编码多为UTF-8，如果JVM默认编码和控制台编码不一致，就会在字符转换时出现错误。

2. Scanner的默认编码问题

上述示例中Scanner直接接收System.in字节流，默认使用的是JVM的默认编码解析字节，若JVM默认编码是UTF-8，而控制台输出的是GBK编码的字节，解析自然会出现错误，重音字符的字节数通常大于1，更容易出现截断或者映射错误。

3. 字符集不支持

如果使用的编码字符集本身不支持重音字符，比如使用US-ASCII字符集，那么所有非ASCII字符都会被替换为无法识别的占位符，自然无法正确读取。

解决方案

方案一：手动指定InputStreamReader的编码

最通用的解决方式是在读取控制台输入时，显式指定和控制台一致的编码，通过InputStreamReader转换字节流为字符流：

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;

public class ConsoleReadFix1 {
    public static void main(String[] args) {
        // 指定编码为控制台实际使用的编码，Windows下可改为GBK，Linux/macOS下用UTF-8
        try (BufferedReader reader = new BufferedReader(new InputStreamReader(System.in, "UTF-8"))) {
            System.out.println("请输入带重音的字符：");
            String input = reader.readLine();
            System.out.println("你输入的内容是：" + input);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

这种方式不依赖JVM默认编码，只要编码参数和控制台实际编码匹配，就可以正确读取重音字符。

方案二：修改JVM启动参数指定默认编码

可以在启动Java程序时，通过-Dfile.encoding参数指定JVM的默认编码，让JVM编码和控制台编码保持一致：

# Windows下如果控制台是GBK编码，启动时添加参数
java -Dfile.encoding=GBK ConsoleReadDemo

# Linux/macOS下如果终端是UTF-8编码，启动时添加参数
java -Dfile.encoding=UTF-8 ConsoleReadDemo

这种方式修改后，程序内所有依赖默认编码的逻辑都会使用指定的编码，不需要逐个修改流处理的代码。

方案三：使用Console类读取（仅限支持Console的环境）

如果运行环境支持java.io.Console，可以使用该类的读取方法，它会自动适配控制台的编码：

public class ConsoleReadFix2 {
    public static void main(String[] args) {
        // 注意：在IDE的运行环境或者某些非交互式环境下，Console可能为null
        if (System.console() != null) {
            String input = System.console().readLine("请输入带重音的字符：");
            System.out.println("你输入的内容是：" + input);
        } else {
            System.out.println("当前环境不支持Console，请使用其他方案");
        }
    }
}

不同场景的编码选择参考

可以通过下表快速匹配不同场景下的编码选择：

运行环境	控制台默认编码	推荐使用的编码参数
Windows cmd/PowerShell	GBK	GBK
Linux终端	UTF-8	UTF-8
macOS终端	UTF-8	UTF-8
IDE内置终端	通常和IDE设置的文件编码一致，多为UTF-8	UTF-8

注意事项

不要假设所有环境的默认编码都是UTF-8，跨平台程序必须显式处理编码逻辑。
如果使用Scanner，可以通过构造方法指定编码：new Scanner(System.in, "UTF-8")，效果和手动使用InputStreamReader一致。
测试时需要确认当前控制台的编码，Windows下可以通过chcp命令查看，返回936代表GBK，65001代表UTF-8。

Java 控制台输入字符编码重音字符 InputStreamReader修改时间：2026-06-27 11:30:35

免责声明：已尽一切努力确保本网站所含信息的准确性。网站内容多为原创整理与精心编撰，观点力求客观中立。本站旨在免费分享，内容仅供个人学习、研究或参考使用。若引用了第三方作品，版权归原作者所有。如内容涉及您的权益，请联系我们处理。