当前位置: 首页 > news >正文

java 字符集

ASCII 与 GBK

  • ASCII:英文专用
  • GBK:中文专用

在这里插入图片描述

万国码

  • unicode想要统一这个世界上所有的语言,所以创造了UTF-32
  • 但是使用32位,也就是4个字节,对于很多语言来说,过于奢侈,也会造成通信效率存储效率变低

在这里插入图片描述

UTF-8

  • unicode 创造出来没人用,就很尴尬,就出现了
  • utf-8 是Unicode改良的一种方案,采用可变长编码
  • 长度区间:1、2、3、4个字节长度

在这里插入图片描述

编码的时候,应该使用utf-8的编码格式,比较统一
在这里插入图片描述

注意

  • gbk中文是2个字节,unicode字符中文是三个字节
  • 因为很多编码都兼容ASCII,所以英文一般不会乱码
    在这里插入图片描述

编码与解码

  • 尽量使用第二种,指定编码格式,更加明确

在这里插入图片描述
在这里插入图片描述

// 编码 这个方法是属于String类的方法
bytes = str.getBytes(StandardCharsets.UTF_8);
// 解码 这个方法是属于String类的构造方案
String parseStr = new String(bytes, StandardCharsets.UTF_8);
System.out.println(parseStr);
http://www.lryc.cn/news/339220.html

相关文章:

  • Alibaba --- 如何写好 Prompt ?
  • 用html写一个雨的特效
  • 前端 接口返回来的照片太大 加载慢如何解决
  • 003 传参
  • QT写Windows按键输出(外挂)
  • Stable Diffusion之文生图模型训练
  • SpringBoot整合支付宝沙箱支付
  • 探索进程控制第一弹(进程终止、进程等待)
  • 在mac环境下使用shell脚本实现tree命令
  • 递归时间复杂度分析方法:Master 定理
  • 实例名不规范导致mds创建失败
  • OpenGL中的纹理过滤GL_NEAREST和GL_LINEAR
  • vue 性能优化
  • 互联网大厂ssp面经(操作系统:part1)
  • Android Activity 启动涉及几个进程
  • 说说你对链表的理解?常见的操作有哪些?
  • 每天五分钟深度学习:逻辑回归算法的损失函数和代价函数是什么?
  • llama-factory SFT系列教程 (二),大模型在自定义数据集 lora 训练与部署
  • C语言游戏实战(11):贪吃蛇大作战(多人对战)
  • 腾讯测试岗位的面试经历与经验分享【一面、二面与三面】
  • 手机移动端网卡信息获取原理分析
  • 无人新零售引领的创新浪潮
  • SD-WAN提升企业网络体验
  • Docker搭建Let‘s Encrypt
  • 单链表讲解
  • DFS算法系列 回溯
  • Linux C应用编程:MQTT物联网
  • 企业常用Linux文件命令相关知识+小案例
  • Istio介绍
  • 代码随想录算法训练营第四十七天|leetcode115、392题