当前位置: 首页 > news >正文

字体反爬慢慢总结破解方式

什么是字体反爬

网页开发者自己创造一种字体,因为在字体中每个汉字都有其代号,那么以后再网页中不会直接显示这个文字的效果。而是显示其代号,因此即使获取了网页的文本内容。也只是获取到文字的代号,而不是文字本身。
简单来说,字体反爬指的是浏览器页面上的字符和调试窗口或者源码中的内容,显示的不一样,这就是字体反爬虫。
在这里插入图片描述

编码原理

  • bit: 由0和1构成的二进制。
  • Byte(z字节): 1字节由八个连续二进制位,或2个16进制数表示。
  • 字符:计算机中使用的数字、字母、符号。

ASCII编码对照表

在这里插入图片描述

ASCII码

ASCII 码使用指定的7位或8位二进制数组合来表示128或256种可能的字符。标准ASCII码也叫基础ASCII码,使用7位二进制数(剩下的1位二进制为0)来表示所有的大写和小写字母,数字0 到9、标点符号,以及在美式英语中使用的特殊控制字符

Unicode码

Unicode码

Unicode为世界上所有字符都分配了一个唯一的数字编号,这个编号范围从 0x000000 到 0x10FFFF(十六进制),有110多万,每个字符都有一个唯一的Unicode编号,这个编号一般写成16进制,在前面加上U+。例如:”爬“的Unicode是U+722C。它是一种规定,Unicode本身只规定了每个字符的数字编号是多少,并没有规定这个编号如何存储
理论上可以直接把Unicode编号直接转换成二进制进行存储,而Unicode并不是这么操作,因为除了这种直接转换成二进制的方案外,还有其他方案,主要有UTF-8,UTF-16,UTF-32,gbk。(UTF-8、UTF-16、UTF-32……都是 Unicode编码 的一种实现。)

utf-8编码方式

在这里插入图片描述
UTF-8最大特点,都是其是一种变长的编码方式,它可以使用1-4个字节表示一个符号,根据不同的符号变化字节的长度。

http://www.lryc.cn/news/34396.html

相关文章:

  • Kafka 位移提交
  • kubernetes--监控容器运行时:Falco
  • HTTP协议详解(上)
  • java性能-原生内存-内存分析
  • c++类与对象
  • Java并发编程与API详解
  • 【冲刺蓝桥杯的最后30天】day5
  • 大厂与小厂招人的区别,看完多少有点不敢相信
  • 前端ES5对象特性
  • Linux入门介绍及Linux文件与目录结构
  • 超赞,用python实现流媒体服务器功能,寥寥几句搞定。
  • 冥想第七百二十一天
  • 06-Oracle表空间与用户管理
  • Mysql 索引特点
  • 读书笔记-终身学习
  • 了解栈Stack一篇文章就够了
  • CNStack 助推龙源电力扛起“双碳”大旗
  • ruoyi-vue-plus1(控制台相关的输出日志)(p6spy插件)(jackson全局配置)(StopWatch)
  • 【Mybatis】| 如何创建MyBatis的工具类
  • 【Java】DT怎么写?
  • xcode14安装swift package设置github账户token
  • css面试题1
  • Hive基础
  • 信息收集-
  • 【sdx12】sdx12获取Serial Number操作方法及源码分享Serial Number的寄存器地址
  • 23种设计模式-工厂模式(安卓应用场景介绍)
  • sheng的学习笔记-服务熔断与降级组件Hystrix
  • 简单给WordPress怎么添加自定义字段面板
  • 大数据框架之Hive:第6章 查询
  • CentOS 8搭建EMQX集群