当前位置: 首页 > news >正文

MySQL的数据类型和细节

1.整型

数值类型字节描述
TINYINT[UNSIGNED]1很小的整数,默认有符号
[-128,127]/[0,255]
SMALLINT[UNSIGNED]2较小的整数,默认有符号
[-32768,32767]/[0,65535]
MEDIUMINT[UNSIGNED]3中等的整数,默认有符号
[-8388608,8388607]/[0,16777215]
INT[UNSIGNED]/INTEGER[UNSIGNED]4标准的整数,默认有符号
[-2147483648,2147483647]/[0,4294967295]
BIGINT[UNSIGNED]8较大的整数,默认有符号
[-9223372036854775808,9223372036854775807]/[0,18446744073709551615]

如果插入了超出对应字段合法范围的数据,MySQL 就会拒绝插入的行为,因此在 MySQL 看来,所有能插入的数据都是合法的,因此数据类型实际上就是一种约束(我们以后再来好好理解这个词,现在先简单了解一下),倒逼程序员进行正确的操作,保证数据插入的合法性。

2.二进制类型

二进制类型描述
BIT(M)位类型,M 为指定位数,默认值为 1,范围为 [1-64]
TINYBLOB很小的二进制数据
BLOB二进制大对象
MEDIUMBLOB中等大小的二进制数据
LONGBLOB较大的二进制数据

MySQL 通常按照 ASCII 码值显示的,因此无法直接显示位类型的 0/1 ,我们可以使用十进制来查看(例如 select hex(bit_data) from table_name;)。

而因此插入的一些二进制值达到 ASCII 的合法范围时,就会显示出对应的 ASCII 字符。

3.小数类型

小数类型字节描述
FLOAT[(M,D)][UNSIGNED]4单精度浮点数,默认有符号,M 为显示长度,D 为小数位数/精度
DOUBLE[(M,D)][UNSIGNED]双精度浮点数,默认有符号
DECIMAL(M,D)[UNSIGNED]定点数,适用于存储精确的小数,默认有符号

浮点类型如果规定了小数点的位数,则显示的长度里包含小数点规定的位数(但是不包含小数点),例如插入 10.0 会显示 10.00,插入 100.1 会插入失败(实际插入的是 100.10)。

但是如果插入多余的小数位,会发生四舍五入的存储,例如插入 10.016,实际插入的值是 10.02

因此也无法插入 99.996,但是允许插入 99.9900001

一般浮点数的数值很大,一般不会关心一个浮点数的大小,用户只需要根据自己的需求设置显示位数和精度即可。

浮点类型可能存在较大的数据缺失问题,而定点数类型则可以尽可能规避这个问题(如果希望精度更高就需要使用 decimal 类型)。

4.文本类型

文本类型描述
CHAR(L)定长字符串,L 为存储长度,最大值为 255,单位是一个“字符”
VARCHAR(L)变长字符串,L 的最大值为 65535 个“字节”,但是其中有 1~3 个字节需要记录数据大小,因此有效字节数为 65532。在 utf8 中也就是最多 65532/3=21844 个字符(*3),在 gbk 中也就是 65532/2=32766(也就是说,具体字符个数和所用编码密切相关)。
BINARY定长二进制字符串
VARBINARY变长二进制字符串
TINYTEXT很小的文本数据
TEXT普通的文本数据
MEDIUMTEXT中等的文本数据
LONGTEXT较大的文本数据

不定长的字符串可以会影响查询效率,但是空间利用率较高。在使用 varchar 类型是,上限就是 L,是“有多少用多少,不超过 L”,而定长的字符串是“就算只有这么多,也会占用 L”,两者的区别类似 C/C++char s[size]std::string str 的区别。

另外需要注意一个汉字字符也是一个字符,这点很特殊,即使一个中文汉字用多个字节表示,也依旧可以使用 char(1) 来表示(但是需要注意有时候会报字符集不匹配的错误)。

疑惑:关于 VARCHAR(L) 中的 L 是字符个数还是字节个数,貌似不同版本的 MySQL 是不一样的。

5.时间类型

时间类型字节描述
DATE3日期值,格式为 yyyy-mm-dd,对于时间精度只需要到天数时就使用该类型,需要程序员自己登记修改
DATETIME8日期和时间值,格式为 yyyy-mm-dd HH:ii:ss,需要程序员自己登记修改
TIMESTAMP4时间戳,格式和 DATETIME 一样,该字段会自动填入(若使用 UPDATE table_name set field_name='new_value' 更新同一项的其他字段数据时,将会自动更新),因此时间戳经常被用于数据被更新的最近时间点,无需程序员自己登记修改
TIME时间
YEAR年份

6.复合类型

复合类型描述
ENUM枚举(单选)。只是设定若干选项,最终在单元格中只存储了一个实际值,枚举值的大小范围为 [1,65535],使用方法和 C/C++ 的枚举体类似,枚举字段的数据只允许填入之前枚举出的所有值。并且,如果插入的数字是合法范围的值,也会转为为对应的枚举标识(如果忽略该字段会自动填入 NULL,使用 0 作为插入会导致非法操作)
SET集合(多选)。和枚举不同,一个列可以拥有多个值,多个值作为一个字段数据插入的时候,整体看作一个字符串即可。并且我们还可以使用数字来插入数据,该数字为 0001 代表四个元素中的第一个元素,若为 0101 则代表四个元素中的第一、第三个元素(如果忽略该字段会自动填入 NULL,使用 0 作为插入会导致为空)

使用 FIND_IN_SET(SUB, STR_LIST) 可以来查找集合中是否有某“一个”元素,若 sub 这个单一元素在 str_list(不要在逗号后面加空格) 集合中则返回其下标,若不存在则返回 0

而如果我们直接使用 where field_name='new_value' 子句来查询集合时,采用的是严格匹配法,我们需要不严格匹配时,就需要使用上述 find_in_set() 的接口。

也就是使用 SELECT * FROM table_name WHERE FIND_IN_SET(sub, STR_LIST) 来查询,这样只要有一个元素存在于集合字段中,就可以被查询出来。

而如果希望包含多个元素,就需要使用 AND 来级联多个接口,也就是使用 SELECT * FROM table_name WHERE FIND_IN_SET(sub_1, STR_LIST) AND FIND_IN_SET(sub_2, STR_LIST) AND ...

补充:NULL(空) 是两种东西。

7.布尔类型

布尔类型描述
BOOL使用 0/1 表示“真/假”

使用起来较简单,略,待补充…

http://www.lryc.cn/news/302581.html

相关文章:

  • 自建AWS S3存储服务
  • 『论文阅读|研究用于视障人士户外障碍物检测的 YOLO 模型』
  • LeetCode--1445. 苹果和桔子
  • Java基础知识
  • 并发编程-Synchronized
  • C语言——从头开始——深入理解指针(1)
  • 微信小程序-绑定数据并在后台获取它
  • 【删除数组用delete和Vue.delete有什么区别】
  • 【QT+QGIS跨平台编译】之四十二:【QWT+Qt跨平台编译】(一套代码、一套框架,跨平台编译)
  • yum方式快速安装mysql
  • 基于Java的家政预约管理平台
  • C语言前世今生
  • android aidl进程间通信封装通用实现-用法说明
  • 【Java中23种设计模式-单例模式2--懒汉式线程不安全】
  • 【后端高频面试题--Linux篇】
  • 网络原理HTTP/HTTPS(2)
  • 【Java中23种设计模式-单例模式2--懒汉式2线程安全】
  • 由LeetCode541引发的java数组和字符串的转换问题
  • HTTP 头部- Origin Referer
  • Python 实现Excel 文件合并
  • ECMAScript 6+ 新特性 ( 一 )
  • 动态DP入门线性动态DP
  • 基于python+django+vue.js开发的停车管理系统
  • 网站管理新利器:免费在线生成 robots.txt 文件!
  • 【Java程序员面试专栏 Java领域】Java虚拟机 核心面试指引
  • 洛谷C++简单题小练习day15—计算阶乘小程序(不用循环)
  • Vue报错,xxx is defined #变量未定义
  • Idea启动Gradle报错: Please, re-import the Gradle project and try again
  • Python函数(一)
  • Excel表的内容批量生成个人加水印的Word文档