当前位置: 首页 > news >正文

常见的几种计算机编码格式

前言: 计算机编码是指将字符、数字和符号等信息转换为计算机可识别的二进制数的过程,正因如此,计算机才能识别中英文等各类字符。计算机中有多种编码格式用于表示和存储文本、字符和数据,实际走到最后都是二进制,本质一样。

目录

  • 常见的几种计算机编码格式
  • 在windows下如何查看文件的编码格式?

常见的几种计算机编码格式

(1)ASCII(American Standard Code for Information Interchange):ASCII 是最早的字符编码标准,用于表示英文字母、数字和一些特殊字符。每个字符用一个 7 位的二进制数表示。
(2)Unicode: Unicode 是一个更加全面的字符编码标准,它可以表示几乎所有世界上使用的字符。不同的字符在 Unicode 中有唯一的编号,通常用十六进制表示。
①UTF-8(Unicode Transformation Format-8):UTF-8 是一种可变长度的 Unicode 编码方式,它使用 8 位二进制来表示字符。它在表示英文字母和 ASCII 字符时使用一个字节,而在表示其他字符时可以使用多个字节。
②UTF-16: UTF-16 是另一种 Unicode 编码方式,使用 16 位二进制来表示字符。它在表示英文字母和大部分常用字符时使用两个字节,而在表示一些罕见字符时使用四个字节。
③UTF-32: UTF-32 使用 32 位二进制来表示字符,每个字符都占用相同数量的字节。这种编码方式在存储空间上通常会更浪费,因为大部分字符只需要较少的位来表示。
(3)ISO-8859 系列:ISO-8859 是一系列字符编码标准,每种标准都专注于一种特定语言或语言组。例如,ISO-8859-1 是用于表示西欧语言字符的编码。
(4)CP1252(Windows-1252):这是一个用于西欧语言的编码,它在很多 Windows 系统中被广泛使用。
(5)EBCDIC:EBCDIC 是一种 IBM 开发的字符编码,曾经在一些老的 IBM 计算机系统中使用。
(6)Baudot Code:这是最早的用于电传打字机的编码标准,现在已经很少使用。
(7)GB2312、GBK 和 GB18030:这些是中文字符编码标准,用于表示汉字和其他中文字符。
以上只是一些常见的编码格式,实际上还有许多其他编码格式用于不同的语言和场景。在处理文本和字符数据时,了解使用的编码格式非常重要,以免出现乱码或错误解释的情况。

在windows下如何查看文件的编码格式?

1、以txt文件为例。首先必须打开该文件,依次点击文件-另存为。
在这里插入图片描述
2、在弹出的另存为对话框中,就可以看到文件的编码格式了,紫色框中。
在这里插入图片描述

http://www.lryc.cn/news/252633.html

相关文章:

  • 3D旋转tab图
  • openGL 三:矩阵和向量
  • Socket和Http的通讯原理,遇到攻击会受到哪些影响以及如何解决攻击问题。
  • 【springboot】整合redis
  • 回溯和分支算法
  • 深入理解:指针变量的解引用 与 加法运算
  • Docker 镜像构建的最佳做法
  • 工作上Redis安装及配置
  • 电商项目之Web实时消息推送(附源码)
  • 上机实验四 哈希表设计 西安石油大学数据结构
  • Ubuntu22.04 交叉编译mp4V2 for Rv1106
  • 缓存穿透、击穿、雪崩
  • (1w字一篇理解透Unsafe类)Java魔法类:Unsafe详解
  • Python的正则表达式使用
  • Elasticsearch:评估 RAG - 指标之旅
  • 【2023.12.4练习】数据库知识点复习测试
  • 【wvp】测试记录
  • 【若依框架实现上传文件组件】
  • 玩转大数据5:构建可扩展的大数据架构
  • 【华为数据之道学习笔记】非数字原生企业的特点
  • Kubernetes学习笔记-Part.01 Kubernets与docker
  • k8s学习
  • 测试:JMeter和LoadRunner比较
  • (C语言)通过循环按行顺序为一个矩阵赋予1,3,5,7,9,等奇数,然后输出矩阵左下角的值。
  • GitHub项目推荐-Deoldify
  • 微前端qiankun示例 Umi3.5
  • 熬夜会秃头——beta冲刺Day7
  • IntelliJ IDEA设置中文界面
  • RTSP流媒体播放器
  • 使用正则表达式时-可能会导致性能下降的情况