当前位置: 首页 > news >正文

AES加密的中文乱码与Java默认编码

0. 背景

win11环境下 + java8 + idea
开发的项目接口有加密需求,暂时使用AES完成,AES工具类代码如下

 public static String aesEncrypt(String content, String key) throws Exception {//指定加密算法Cipher cipher = Cipher.getInstance("AES");//创建加密规则:指定key和加密类型SecretKeySpec secretKeySpec = new SecretKeySpec(key.getBytes(), "AES");//指定加密模式为加密,指定加密规则cipher.init(Cipher.ENCRYPT_MODE, secretKeySpec);//调用加密方法byte[] result = cipher.doFinal(content.getBytes());//用Base64编码return new String(Base64.getEncoder().encode(result));}public static String aesDecrypt(String content, String key) throws Exception {//Base64解码byte[] result = Base64.getDecoder().decode(content);//指定加密算法Cipher cipher = Cipher.getInstance("AES");//创建加密规则:指定key和加密类型SecretKeySpec secretKeySpec = new SecretKeySpec(key.getBytes(), "AES");//指定加密模式为解密,指定加密规则cipher.init(Cipher.DECRYPT_MODE, secretKeySpec);return new String(cipher.doFinal(result));}

本地开发/测试都能正常解密,在自己的Linux(centos)机器测试接口也没有出现中文乱码的问题.

之后公司暂时只有Windows服务器空闲,只提供了windows服务器用于部署接口程序进行UAT,
UAT的时候用户请求接口得到密文后解密后中文就乱码为 ???,确认不开加密明文传输中文不会乱码,问题出在AES加密上

1.原因与正确写法

改为下面的代码后中文就正常了

public String encrypt(String plainText, String key) throws Exception {Cipher cipher = Cipher.getInstance(AES);SecretKeySpec secretKeySpec = new SecretKeySpec(key.getBytes(StandardCharsets.UTF_8), AES);cipher.init(Cipher.ENCRYPT_MODE, secretKeySpec);byte[] result = cipher.doFinal(plainText.getBytes(StandardCharsets.UTF_8));return Base64.getEncoder().encodeToString(result);
}public String decrypt(String encryptedText, String key) throws Exception {Cipher cipher = Cipher.getInstance(AES);SecretKeySpec secretKeySpec = new SecretKeySpec(key.getBytes(StandardCharsets.UTF_8), AES);cipher.init(Cipher.DECRYPT_MODE, secretKeySpec);byte[] decodedBytes = Base64.getDecoder().decode(encryptedText);byte[] decryptedBytes = cipher.doFinal(decodedBytes);return new String(decryptedBytes, StandardCharsets.UTF_8);
}

与之前代码相比,显式声明了getBytes()方法应该采用utf-8编码


原因:
jdk8下,getBytes()方法来自String类,最终调用了StringCoding类的encode方法.方法的默认编码首先是取平台默认编码, Charset.defaultCharset()!

 String csn = Charset.defaultCharset().name();try {// use charset name encode() variant which provides caching.return encode(csn, ca, off, len);} catch (UnsupportedEncodingException x) {warnUnsupportedCharset(csn);}

在windows服务器上使用 Charset.defaultCharset().name(); 发现编码集是 windows-1252!非utf-8,自然就有问题!!
所以代码中需要显示声明编码为utf-8!!!

Windows-1252 编码是一种单字节编码,它主要用于表示西欧语言中的字符,包括英语、法语、德语等。在 Windows-1252 编码中,并没有包含中文字符所需的字节范围,因此无法正确表示中文字符。

2.Java默认编码

上述问题解决后,我才意识了自己有一个误解:java的默认编码是utf-8
现在想想,这样的误解来自学习时老师强调创建新项目后,总要设置/检查是否为utf-8编码,用的时间长了,就默认java编码就是utf-8,真是不应该

查询发现,

  • JDK18及之后,java默认编码根据jep400变成了UTF-8

  • 在JDK18之前(例如jdk8),默认字符集在很大程度上取决于操作系统:大部分Linux上是UTF-8;Windows机器上可能是Windows-1252(尤其是在西欧)或Windows-31j(日语)


虽然这一次问题的大头是 没注意Windows服务器的原因,不过代码中没有强调utf-8也的确是一个漏洞,以后在做字节序列和字符序列(byte/char/String) 需要特别注意编码问题!

3.参考阅读

  • JDK 18 and the UTF-8 as default charset
  • 为什么使用 Java Cipher 要指定转换模式?
http://www.lryc.cn/news/322356.html

相关文章:

  • Node.js笔记 (二)浏览器和服务器
  • 面试经典-32-判断子序列
  • windows使用知识
  • 用python如何实现智能合约?如何使用remix编写solidity智能合约并部署上链
  • Electron窗口管理详解:使用BrowserWindow API打造个性化界面
  • 19---时钟电路设计
  • PSNR/SSIM/LPIPS图像质量评估三件套(含代码)
  • 20240318uniapp怎么引用组件
  • 扩展以太网(数据链路层)
  • 每日一练 | 华为认证真题练习Day202
  • 基于python+vue的幼儿园管理系统flask-django-php-nodejs
  • 【java】java环境变量分类
  • 掌握Go语言:Go语言通道,并发编程的利器与应用实例(20)
  • JavaSE(上)-Day9
  • Java 内存模型概述
  • 远程桌面安卓版下载 安卓远程控制免费版
  • 算法打卡day18|二叉树篇07|Leetcode 530.二叉搜索树的最小绝对差、501.二叉搜索树中的众数、236. 二叉树的最近公共祖先
  • MySQL 中的自增ID及其应用场景
  • ChatGPT高效完成简历制作[中篇4]-有爱AI实战教程(十一)
  • 5.2.5、【AI技术新纪元:Spring AI解码】VertexAI Embeddings
  • 【vue baidu-map】实现百度地图展示基地,鼠标悬浮标注点展示详细信息
  • uniapp canvas文字和元素居中
  • 深度探索:SWAT模型和生物地球化学循环模型实现流域生态系统水-碳-氮耦合过程模拟
  • C语言经典算法-5
  • python与excel第二节
  • Google云计算原理与应用(四)
  • 面试常问:为什么 Vite 速度比 Webpack 快
  • principles of network applications网络应用原理
  • QT增加线程函数步骤流程
  • Python基础----字符串(持续更新中)