32 KiB
Mysql Data Type
Mysql数字类型语法
整型数据类型
对于整型数据类型,M代表最大的显示宽度。该最大显示宽度是255。显示宽度和该整型类型可以存储范围的值没有关系。在mysql 8.0.17中,整型的M值已经被遗弃。
# 将M限定为4并不会限制INT类型可以存储值的范围
INT(4)
将M限定为4时,当应用使用该字段整型值时,如果该字段值显示宽度小于M,会在左边填充空格
非整型数据类型
对于浮点类型和fixed-point数据类型,M代表该字段总共能够存储多少位,M为能存储的最多位长度(十进制)。
zerofill
对于数字类型的类型,可以为其指定zerofill,在指定为zerofill后,会为其自动添加unsigned约束,该数字类型字段存储的值不论是整型还是浮点数均需要为非负值。
# 被zerofill修饰的字段,如果显示宽度小于M,那么都会在左边填充0
# 其等同于INT(10) UNSIGNED ZEROFILL
INT(10) ZEROFILL
DECIMAL(28,2) ZEROFILL
在mysql8.0.17,zerofill对于数值类型字段也被遗弃了
unsigned
对于数值类型的字段,可以支持unsiged和signed属性。默认情况下数值类型是signed的,可以手动将其指定为unsigned。 在mysql8.0.17,对于float、decimal、double类型,unsigned属性也被遗弃了。可以通过简单的check来进行替换
serial
serial是一个对于BIGINT UNSIGNED NOT NULL AUTO_INCREMENT UNIQUE的alias。
# 如下字段定义
id serial
# 等同于
id bigint unsigned not null auto_increment unique
BIT[(M)]
bit值类型,M代表每个值的bit位数,M值可以从1到64,默认情况下若M省略,M为1
TINYINT[(M)] [UNSIGNED] [ZEROFILL]
8位整型,有符号范围为-128到127,无符号范围为0到255
BOOL,BOOLEAN
该类型等同于TINYINT(1),值为0代表false,值非0代表true
SMALLINT[(M)] [UNSIGNED] [ZEROFILL]
16位整型,有符号范围为 -32768到32767,无符号范围为0 到 65535
MEDIUMINT[(M)] [UNSIGNED] [ZEROFILL]
24位整型,有符号范围为-8388608到8388607,无符号范围为 0 到16777215
INT[(M)] [UNSIGNED] [ZEROFILL]
32位整型,有符号范围为-2147483648 到2147483647,无符号范围为0 到4294967295
BIGINT[(M)] [UNSIGNED] [ZEROFILL]
64位整型,有符号范围为 -9223372036854775808到9223372036854775807,无符号范围为0到18446744073709551615
所有算数都是使用带符号的bigint或者double进行运算,故而不要使用bigint大于 9223372036854775807 (63bit)
DECIMAL[(M[,D])] [UNSIGNED] [ZEROFILL]
fixed-point nubmer,M是非整型的总共的位数,而D对应的则是小数点之后的位数。小数点和负的符号并不包含在M中。
如果D是0,则代表该数没有小数部分。***对于DECIMAL来说,M最大值为65,D受支持的最大值为30,如果D省略,则D默认为0,若M省略,那么M的默认值为10
FLOAT[(M,D)] [UNSIGNED] [ZEROFILL]
单精度浮点数,M为非整型总共的位数,D为小数点之后的位数。如果M和D省略,那么会根据硬件的限制来存储。单精度浮点数大概精确到小数点后7位。
FLOAT(M,D)是一个非标准的mysql拓展,在mysql 8.0.17中,该语法被废弃
DOUBLE[(M,D)] [UNSIGNED] [ZEROFILL]
双精度浮点数,其精度大概精确到小数点后15位
DECIMAL和NUMERIC
DECIMAL和NUMERIC用于存储高精度的数值类型,当保存数字的精度很重要时需要使用这些类型,如货币数据。在mysql中,NUMERIC类型被实现为DECIMAL
BIT
对于bit类型,其赋值可以使用b'value',其中value为二进制类型。
# 其返回值为true
select b'011' = 3;
mysql日期和时间类型
日期和时间类型语法
对于time、datetime、timestamp类型,mysql允许second(秒)具有小数部分,最高精度到小数点后6位(微秒)。
time、datetime、timestamp定义小数部分格式如下
type_name(fsp)
- type_name为date、datetime、timestamp中的一个
- fsp为second的小数部分精度
CREATE TABLE t1 (t TIME(3), dt DATETIME(6), ts TIMESTAMP(0));
对于fsp,其必须位于0~6的范围内,0代表其没有小数部分。若fsp省略,则默认情况下fsp为0.
date
支持的日期是'1000-01-01'到'9999-12-31'。mysql通过'YYYY-MM-DD'的格式来显示date数据,但是对于date类型的赋值,既可以通过字符串类型也可以通过数字类型。
datetime(fsp)
datetime类型是date和time类型的组合。datetime类型支持的范围是 '1000-01-01 00:00:00.000000'到'9999-12-31 23:59:59.999999',mysql展示datetime类型值是通过'YYYY-MM-DD hh:mm:ss[.fraction]'格式。同样的,datetime类型的赋值可以通过字符串类型和数字类型。
timestamp(fsp)
时间戳类型。timestamp类型支持的范围是'1970-01-01 00:00:01.000000' UTC 到 '2038-01-19 03:14:07.999999' UTC。timestamp类型的值存储着从('1970-01-01 00:00:00' UTC)其经过的秒数。
timestamp类型不能表示'1970-01-01 00:00:00',因为该时间点等于timestamp类型的计时起点,但是timestamp类型中0已经被预留来代表 '0000-00-00 00:00:00'
explicit_defaults_for_timestamp已启用
如果 explicit_defaults_for_timestamp 属性已经被启用,那么不会将CURRENT_TIMESTAMP赋值给timestamp字段做默认值,也不会在更新时自动将CURRENT_TIMESTAMP赋值给timestamp字段。并且,任何没有声明为not null的timestamp字段都是可为空的。
explicit_defaults_for_timestamp未启用
除非被显式指定,否则数据表中的timestamp列都会被赋值为最近修改的datetime。该属性开未开启时,可以通过timestamp字段记录上次update或insert时间。
可以通过为timestamp字段赋值一个null来将该字段设置为当前时间,除非该字段在定义时通过NULL属性声明该字段可以为空。
自动赋值为当前时间和记录更新时间设置 可以在定义该timestamp列字段时指定DEFAULT CURRENT_TIMESTAMP和ON UPDATE CURRENT_TIMESTAMP,为该timestamp字段指定默认值和记录最近更新时间。若explicit_defaults_for_timestamp未启用,默认情况下,若第一个timestamp列没有指定default和on update属性中的任何一个,第一个timestamp列字段具有这些属性,数据表中的任何timestamp字段也可以手动指定这些属性。
time(fsp)
time类型的范围为'-838:59:59.000000'到'838:59:59.000000',msyql显示time类型的格式为'hh:mm:ss[.fraction]',但是对time类型的赋值既可以用字符串类型也可以用数字类型。
YEAR(4)
year类型用来表示年,year类型通过YYYY格式进行展示,为year类型字段赋值既可以通过字符串类型也可以通过数字类型。
对于时间类型,avg和sum等聚合函数不起作用。该类聚合函数会将值转化为数字,并在遇到第一个非数字字符时转换失败。如果想要对时间类型使用聚合函数,需要在使用前将时间类型转化为数字单元,并在聚合后将数字单元转化为时间类型,如下:
SELECT SEC_TO_TIME(SUM(TIME_TO_SEC(time_col))) FROM tbl_name; SELECT FROM_DAYS(SUM(TO_DAYS(date_col))) FROM tbl_name;
mysql中timestamp的存储
在mysql中,timestamp在存储时,会从本地时区转化为UTC时区然后再存储到数据库中,在获取存储的timestamp时会从UTC时区转化为本地时区(该行为在其他类型,如datetime,中则不会发生)。
mysql中的时区
在默认情况下,对于每个Connection,当前时区为mysql server的时区。但是,Connection时区也可以针对每个Connection单独设置(在jdbc:mysql://{server}:{port}/{db_name}?{追加参数}中单独设置)。
由于时区统一转化为UTC后再存储于数据库中,那么在存储了timestamp之后,若再次访问timestamp时时区发生了改变,那么将存储的UTC时区timestamp转化为Connection对应时区时,转化后时区时间和存储时的时区时间并不相同。
time、datetime和timestamp传入无效值时
对于无效的time、datetime、timestamp值,会将其转化为该类型默认的‘0’值,例如'0000-00-00'或者'0000-00-00 00:00:00'。
tmestamp转化为datetime
可以通过cast()函数和at time zone操作符将timestamp类型转化为datetime类型。
SELECT col,
CAST(col AT TIME ZONE INTERVAL '+00:00' AS DATETIME) AS ut
FROM ts ORDER BY id;
mysql中date部分
- 在mysql中,对于date类型或者timestamp或datetime中的date部分,任何标点符号都可以作为分隔符
'10:11:12' 代表 '2010-11-12' '10:11:12 00:00:00' 代表 '2010-11-12 00:00:00' - 当date中年份只包含两位数时,若年份为00
69,则会变为20002069,若年份为7099,则年份为19701999
time类型
mysql中获取和展示time类型的格式为'hh:mm:ss'。time的范围为'-838:59:59' 到 '838:59:59'。
time范围
之所以time的范围会如此之大并且支持负值,是因为time类型不仅可以用来表示一天中的时间点,还可以用来表示两个时间点之间的间隔(间隔可能超过24h,也有可能为负值)
time类型的缩写
- 缩写中带有冒号':'时,值将会被解释为一天中的时间点,并且,’11:12'将会被解释为'11:12:00'而不是'00:11:12'
- 缩写中不带冒号时,将会被解释为两个时间点之间的间隔。并且,最右边的两个数将会被解释为秒,'1112'和1112也会被解释为'00:11:12'
year类型
在mysql 8.0.19中,不再支持year(4)这种显式指定宽度的方式已经被废弃,并且,过去支持的year(2)类型在8.0.19中也不再被支持。
year类型支持的范围是'1901'到'2155',也可通过数字类型1901到2155指定
timestamp类型和datetime类型自动初始化和更新
对于timestamp类型和datetime类型,可以被自动初始化和更新到当前的时间。
当对timestamp或者datetime字段设置了on update current_timestamp时,若某行中任一其他列的值发生变化,该列变化前后值不同,那么设置了on update的datetime或timestamp字段会更新到当前时间。若update前后所有的列值都与修改之前相同,那么即使执行了update操作,on update列的时间也不会更新。
如果想要防止设置了on update的列在其他列被修改时更新为当前时间,可以显式将该列设置为该列当前的值。# 即使dt被设置了on update,id变更后dt仍然为当前的值 update dt=dt,salary+=10 wherre id = 1000
current_timestamp的同义词
如下同义词都和current_timestamp具有相同的含义
- current_timestamp()
- now()
- localtime
- localtime()
- localtimestamp
- localtimestamp()
timestamp或datetime指定小数位精度
如果timestamp或者datetime类型在声明时使用了小数位精度,那么在current_timestamp后也要指定相同的精度。
CREATE TABLE t1 (
ts TIMESTAMP(6) DEFAULT CURRENT_TIMESTAMP(6) ON UPDATE CURRENT_TIMESTAMP(6)
);
explicit_defaults_for_timestamp
当explicit_defaults_for_timestamp关闭时,timestamp默认情况下是not null的,该类字段不能含有null值,若将字段显式设置为null时,字段值实际被设置为当前时间。若想要允许该字段包含null,可以在声明该字段时显式指定null属性,此时默认值也会变为null。
当explicit_defaults_for_timestamp启用时,只有指定timestamp字段null属性时该字段才能为空。并且,在explicit_defaults_for_timestamp启用时不可以通过赋值字段为null的形式来将timestamp字段设置为当前值。
当explicit_defaults_for_timestamp开启时,默认条件下timestamp类型声明会自动添加null default null
时间函数返回带小数位的时间
默认情况下,now()或current_timestamp()函数返回当前的时间戳,如果参数为空,返回结果并不含有小数位。如果想要为now()或者current_timestamp()函数的返回结果指定小数位,可以为函数参数指定一个0~6的整型参数用来限制返回结果时间的小数点位数。
# 返回时间戳带有4位小数
select current_timestamp(4);
mysql中时间类型之间的转换
date类型
- date类型转化为datetime或timestamp类型时,时间类型将会添加'00:00:00'部分
- date类型转化位time类型时并没有用处,只会转化为'00:00:00'
datetime类型和timestamp类型
- 当datetime类型或timestamp类型转化为date类型时,会考虑time部分秒的小数部分并且对time部分进行舍入,若time部分为‘23:59:59.499’会舍入到当天,而‘23:59:59.500’则是会舍入到下一天。
'1999-12-31 23:59:59.499' -> '1999-12-31' # 舍入到当天
'1999-12-31 23:59:59.500' -> '2000-01-01' # 舍入到下一天
- 当datetime或timestamp类型转化为time类型时,会丢弃date部分
time类型
- 如果time类型转化为datetime类型或是timestamp类型,current_date()返回的date将会被用作date部分。并且,time部分会看作时间段,并且附加在current_date()返回的date部分上。如果time类型的值范围位于'00:00:00'和'23:59:59'之外,那么date部分会根据time部分的值向前或向后变化。
# 若当前current_date()的返回值为'2012-01-01'
# 当time为'12:00:00'时,转化成的datetime为
'2012-01-01 12:00:00'
# 当time为'24:00:00'时,转化成的datetime为
'2012-01-02 00:00:00'
# 当time为'-12:00:00'时,转化成的datetime为
'2011-12-31 12:00:00'
- 当time类型转化为date时,逻辑和上面一样,但是会舍弃得到datetime结果的time部分,即结果为'2012-01-01'、'2012-01-02'或'2011-12-31'
时间类型之间的显式转换
时间类型之间的显式转换可以覆盖隐式转换。例如,在比较date类型和datetime类型时,默认会将date类型转化为datetime类型之后,再比较两个datetime类型。
如果想要再比较date类型和datetime类型时,忽略datetime的time部分,可以手动将datetime类型转化为date类型之后再进行比较。
# 将datetime类型手动通过cast函数转化为date类型之后再进行比较
date_col = CAST(datetime_col AS DATE)
将时间类型转化为数值类型
如果想要将时间类型转化为数值类型,可以使用如下方式:
select datetime_col+0,date_col+0,time_col+0,timestamp_col+0;
当时间类型转化为数值类型时,如果时间类型没有小数部分(N为0),则会转化为整型类型;如果时间类型含有小数部分,则会转化为decimal类型,decimal类型具有n位小数。
String Data Type
mysql中String类型可以分为如下:
- CHAR
- VARCHAR
- BINARY
- VARBINARY
- BLOB
- TEXT
- ENUM
- SET
mysql中String类型的长度单位
对于字符类型String的列(例如CHAR,VARCHAR,TEXT),mysql将其长度规格指定为字符单元。
对于二进制类型的String列(例如BLOB,BINARY,VARBINARY),mysql将长度规格指定为字节单元。
为字符类型String指定字符集和排序规则
对于字符类型的String字段(CHAR,VARCHAR,TEXT,ENUM,SET),可以通过CHARACTER SET属性指定该String字段的字符集,并且可以通过COLLATE属性指定该字段的排序规则。
为字符类型String指定character set和collate的规则:
- 如果charset和collate都被指定,则指定的charset和collate被使用
- 如果charset被指定而collate未被指定,那么指定的charset和charset默认的collate会被使用
- 如果collate被指定但是charset未被指定,那么指定的collate和collate关联的charset会被使用
- 如果charset和collate都没有被指定,那么该字符类型String字段会使用该table表对应的charset和collate
BINARY属性
binary属性是用来指定二进制collate的快捷方式。当使用binary属性来修饰字符类型String字段后,该字段的比较和排序都基于的是字符编码的数值而不是字符排序。
CREATE TABLE t
(
c1 VARCHAR(10) CHARACTER SET latin1 BINARY,
c2 TEXT BINARY
) CHARACTER SET utf8mb4;
CHAR[(M)] [CHARACTER SET charset_name] [COLLATE collation_name]
该String为固定长度为M的字符串,存储时会再字符串的右边一直填充空格字符直到字符串长度为M。M代表
VARCHAR(M) [CHARACTER SET charset_name] [COLLATE collation_name]
M代表该列字段最长支持的字符长度(以字符为单位,而不是字节)。M的范围可以为 0到65,535。varchar类型的最长长度受mysql表数据的最大row size限制(row size最大为65,535 bytes,该上限由该行数据的所有字段之间进行共享)。除了rowsize限制之外,varchar类型的最长长度也受到选用字符集的限制,如utf8mb3字符集每个字符最多需要3个字节,故而对于utf8mb3字符集最多可以含21,844个字符。每个字符需要的字节数也会影响该varchar类型含有的字符数M的上限。
BINARY[(M)]
BINARY类型和CHAR和VARCHAR类型类似,但是BINARY类型存储的是二进制类型,以字节为单位。M代表该列的长度,以二进制字节为单位。如果M省略,则M默认为1
VARBINARY(M)
VARBINARY类型和VARCHAR类型类似,但是存储的是以字节为单位的二进制数据。M代表该列字段以字节为单位的最长长度。
tinyblob
tinyblob类型最多可以存储255个字节长度的二进制数据。每个tinyblob类型的数据存储都需要用一个字节的前缀来记录该tinyblob值的长度(以字节为单位)。
tinytext [CHARACTER SET charset_name] [COLLATE collation_name]
text类型的数据,但是最多存储255个字节长度的字符串。如果字符串中包含的字符占用多个字节,那么字符的最大个数小于255.每个tinytext类型值采用一个字节来记录该tinytext类型值的长度(以字节为单位)。
blob[(M)]
一个blob列,最多含有65535(2^16-1)个字节。blob类型会使用两个字节的前缀来记录该blob类型的最大长度(以字节为单位)。
可以为blob类型指定一个M,如果M被指定,那么mysql在创建该列时会使用可以包含M个字节数据的最小的blob类型。
text[(M)]
一个text列,最多可以含有65535个字符的数据。如果text类型的值含有多字节字符,那么最大字符数量将小于65535.每个text列都会采用2字节的前缀用来记录该text值长度(以字节为单位)。
可以为text类型指定一个M,如果M被指定,那么mysql在创建该列时会采用可以包含M个字符的最小类型的text。
mediumblob
一个blob列,最多可以存储16,777,215(2^24-1,约16MB)个字节的二进制数据,该类型会使用3字节的前缀来记录长度。
mediumtext [CHARACTER SET charset_name] [COLLATE collation_name]
一个text列,最多可以存储16,777,215(2^24-1,约16MB)个字符的文数据,如果该text列的值含有多字节字符,那么该列存储字符的最大数量少于该上限。每个mediumtext类型使用3字节的前缀来记录长度。
longblob
一个blob列,最多可以存储4,294,967,295 (2^32-1,约4GB)字节的二进制数据。每个longblob类型都使用4字节前缀来记录该longblob列的长度(以字节为单位)。
longtext [CHARACTER SET charset_name] [COLLATE collation_name]
一个text列,最多可以存储4,294,967,295个字符的文本。如果含有多字节字符,那么存储的最大字符数量会小于该上限。每个longtext类型会使用4字节的前缀来存储该值长度(以字节为单位)。
ENUM('value1','value2',...) [CHARACTER SET charset_name] [COLLATE collation_name]
枚举类型,一个字段可以含有value1,value2,……中的一个值或者null。enum类型在内部是通过整数类型来表示的,value1从1开始,可以通过select enum_col+0的形式来查看整数值。
enum类型最多可以含有 65,535 个不同的enum元素。
对于每个enum元素,其最大支持长度需要满足如下条件:
- M<=255
- M * w<=1020
其中M是字符串文本的字符长度,而w则是该文本字符所属字符集中单个字符所需要的最大字节数
SET('value1','value2',...) [CHARACTER SET charset_name] [COLLATE collation_name]
string集合,每个string对象可以0个或多个值,每个值都必须属于value1,value2,……。set类型在内部通过int表示。
set类型最多可以含有64个不同的值。 对于每个set元素,其最大支持长度需要满足如下条件:
- M<=255
- M * w<=1020
其中M是字符串文本的字符长度,而w则是该文本字符所属字符集中单个字符所需要的最大字节数
对于set类型字段,插入时如果包含set类型中多个值,多个值之间可以通过逗号','分隔
对于包含多个set元素的值,其值中元素的顺序和出现次数并不重要,'b,b,a,c'和'c,b,b,c,a'在插入后都会变为'a,b,c'
可以通过find_in_set('value',set_col)来查询某个值是否在set_col中
char和varchar类型
对于char类型,其长度是固定的,并且长度需要在创建表字段时指定(长度位于0到255之间)。当char类型的值在存储时,会右填充空格直到长度到达指定长度M。当char类型的值在获取时,会删除尾随填充的空格,除非PAD_CHAR_TO_FULL_LENGTH的sql mode被启用。
如果字段类型被设置为char类型,并且pad_char_to_full_length关闭,那么如果向char类型字段中存入字符串,在取出存入字符串时,存入字符串末尾若存在空格,那么在取出字符串时会删除尾随空格,即使尾随空格不是存入时填充的而是字符串本身就含有的尾随空格
char_col char(30) # 插入字符串值存在尾随空格 insert into string_tb(char_col) values (' a '); # 获取时,字符串本身含有的尾随空格也会被删除 # 返回值并不是' a 1'而是' a1' select concat(char_col,'1') from string_tb;
varchar类型的存储
相较于char类型,varchar类型在存储时,会额外存储1到2个字节长度的前缀,用来记录该varchar类型的长度(以字节为单位)。当该varchar类型值存储不超过255字节时,使用一个字节来记录长度,否则使用两个字节来记录长度。
varchar和char类型的赋值
如果对一个varchar或char类型的字段进行赋值操作,且赋值超过该类型的最大长度:
- 如果strict_mode没有开启,那么赋的值会被截断,并且产生一个warning。
- 如果strict_mode已经被启用,那么在截断非空格字符时,会产生一个异常,并且阻止插入操作。
- 对于varchar类型,在插入时,超过该列长度限制的尾随空格将会被截断,并且会生成一个warning,不论strict_mode是否开启。
- 对于char类型,在插入时,超过该列长度限制的尾随空格也会被截断,并且截断操作是静默的,并不会生成warning。
在比较varchar类型和char类型时对后缀空格的处理
mysql的collate具有一个pad attribute,可以有两个值:
- pad space(绝大多数的mysql collate都具有pad space属性)
- no pad
pad space和no pad的区别:
- pad space:在比较时,尾随空格并不会参加比较,尾随空格并不重要
- no pad:在比较时,尾随空格参与比较,尾随空格在比较时重要
默认情况下,mysql默认字符集为utf8mb4,该字符集默认collate为utf8mb4_0900_ai_ci,其pad attribute为no pad。故而,在默认情况下,mysql对字符串进行比较时,忽略大小写并且尾随空格参与比较。
如果某字符串列其collate的pad attribute为pad space,且该列拥有unique约束,那么在插入值时,'a'和'a '同时插入会对该列产生duplicate-key错误。
binary和varbinary类型
binary,varbinary类型和char,varchar类型相似,不同的是binary、varbinary类型存储二进制形式的字符串。
当插入字符串超过binary或varbinary的最长限制长度时,若strict mode未启用,则字符串会被截断来适应该二进制列的最大长度,并且会产生一个warning;若strcit mode已启用,那么会抛出异常并且插入失败
binary存储值时的逻辑
当binary类型的值被存储时,该插入的值会右填充(0x00)的值直到到达指定长度。并且,在对binary值进行获取时,并不会删除尾随(0x00)。
在对binary类型值进行比较时,所有字节都重要,比较时并不会忽略尾随(0x00)字节。
对于binary类型,其和char类型不同,并不删除尾随字符,其意味着如果‘a’同时插入binary(3)的col_3列和binary(6)的col_6列,从col_3和col_6中取出存储的值进行比较时,col_3和col_6取出的值并不相同,col_3为0x610000,col_6为0x610000000000。
varbinary存储时的逻辑
对于varbinary类型,存储时并不会插入尾随字符,获取时也不会删除尾随字符。
blob类型和text类型
blob类型可以看作一个存储大量二进制字符串数据的对象,而text类型可以看作一个存储大量字符型字符串的对象。
如果strict mode没有开启,那么在给blob类型字段分配超过其长度限制的值时,会对分配的值进行截断并且抛出一个warning;如果strict mode已经开启,那么当截断非空格字符时会抛出异常并且插入失败。
对于text类型,如果插入时对插入值的尾随空格进行截断,那么会抛出警告,无论strict mode是否开启。
对于blob类型和text类型,在插入时并不会有向右的填充字符,在获取时也不会删除尾随字符。(类似于varchar和varbinary)。
关于text类型作为索引的比较逻辑
如果将text类型的列作为索引,必须要指定索引前缀长度,当text值小于索引前缀长度时对索引列的text类型值进行比较时会向右填充空格。即如果该索引需要unique约束,那么两个除了后缀空格数目外完全相同的text值将会产生duplicate-key异常。
blob/text类型与varchar/varbinary类型的区别
在大多数情况下,blob/text类型和varchar/varbinary都相同,但是在如下方面会有所区别:
- 在对blob/text类型字段添加索引时,必须要指定索引前缀长度M。(在对单列创建索引时,必须要复制索引列的值到特定的数据结构如B+树中,故而强制要求blob/text类型创建索引时指定索引前缀长度能够有效的减少复制索引值消耗的空间和比较索引的开销)
create table tb_blob_index ( blob_col blob, index(blob_col(M)) ); - 对于blob类型和text类型的字段并不能为其指定default默认值
blob类型和text类型的排序
由于blob类型和text类型的值可能会很长,故而在对blob类型和text类型的值进行排序时,只会对列开头max_sort_length字节长度的内容进行排序。max_sort_length默认值为1024.
show variables like 'max_sort_length'; # default 1024
enum类型
枚举类型是一个String对象,该对象的值可以从允许的值范围中进行选取。允许的值范围在定义枚举字段时显式指定。
枚举列的创建
create tb_enum (
id bigint auto_increment primary key,
size enum('x-small', 'small', 'medium', 'large', 'x-large')
);
当在插入枚举时,可以有效降低空间的占用量。对于‘medium’值的插入,一百万条枚举类型值的插入只消耗一百万字节,而将'medium‘类型作为字符串插入时,一百万条数据的插入会消耗六百万字节的空间。
枚举类型的值和序号
- mysql中,对于每个枚举类型的值都有一个序号。对于在枚举类型列定义时在括号中指定的枚举类型值,都对应了一个整数序号,序号从1开始(如"small","medium","large"对应1,2,3)。
- 对枚举空字符串(代表error),其对应的index是0.
- 对于枚举值NULL,其index也为NULL
如果想要通过数值的形式获取枚举值,可以通过select enum_col+0的形式,获取枚举值时该枚举值对应的index被返回。
枚举类型插入invalid值
如果对枚举类型插入invalid值(插入值不位于enum定义时的可选值中):
- strict mode没有开启时,会插入一个''作为错误值,该''对应的index是0
- 若strict mode开启,那么插入invalid值会直接导致异常
如果枚举列声明可为null,那么null对于该枚举列则是有效值,该枚举列的默认值为null;如果枚举列声明为not null,那么该枚举列的默认值是index为1对应的枚举值。
枚举值的比较
枚举值的比较是通过比较枚举值的index来进行的。
create table tb_enum (enum_col enum('b','a'));
# 若enum_col_b对应的枚举值是’b',enum_col_a对应的枚举值为enum_col_a
# 那么
enum_col_b < enum_col_a
枚举值的定义
在定义枚举值时,不应该通过表达式来指定枚举值。
# 无法通过concat来指定枚举值为'medium'
CREATE TABLE sizes (
size ENUM('small', CONCAT('med','ium'), 'large')
);
# 无法将枚举值指定为变量
SET @mysize = 'medium';
CREATE TABLE sizes (
size ENUM('small', @mysize, 'large')
);
set类型
set类型是一个字符串类型,其可以含有0个或多个值,每个值都从许可值的范围内选择。set类型的值由一系列set类型的成员组成,成员之间通过逗号','分隔。
# 例如,set('one','two')类型,可以含有如下可能值
'one'
'one,two'
'two'
''
每个set类型最多可以含有64个不同的成员,再set类型字段定义时,如果为set类型字段指定重复的set成员,会触发警告或抛出异常(取决于strict sql mode是否被开启)。
在set类型字段的定义中,如果set类型的成员含有尾随空格,那么尾随空格将会在表创建时自动被移除。
可以为set类型字段分配字符集和collate,对于二进制或者大小写敏感的collate,在赋值时大小写是敏感的。
默认情况下,set类型字段和字符集和collate与数据表相同,在对set类型字段赋值或者进行比较时并不会区分大小写。
set类型值的存储
mysql通过整型来存储set的值,每个候选值对应整型的一个bit。
| set member | decimal value | binary value |
|---|---|---|
| 'a' | 1 | 0001 |
| 'b' | 2 | 0010 |
| 'c' | 4 | 0100 |
| 'd' | 8 | 1000 |
# 如果mysql赋值给set类型字段的值为9,
# 则代表该set类型值组成为8+1
# 则set字段值为'a,d'
如果一个set类型的值含有多个set元素,那么元素之间的排列顺序并没有影响,'a,d'和'd,a'完全相同,值均为9.并且,对于set类型的值,其中一个元素出现的次数也对set值完全没有影响,'a,d,d,d,a,d,a'和'a,d'也完全相同,值均为9.
set类型的值赋值即错误处理
对于set类型,如果赋值中出现了一个定义该set类型字段时没有出现的元素,那么mysql会进行如下处理:
- 若strict sql mode开启,那么会产生异常
- 如果strict sql mode关闭,那么该值会被忽略,赋值正常执行,并且产生一个warning
set类型值中查找某set元素是否存在
对于在set值中查找某元素是否存在,可以通过find_in_set(eleVal,setVal)函数或者like操作符。find_in_set会返回元素在set值中第一次出现的位置,如果元素在set值中没有出现,那么会返回0.
mysql> SELECT * FROM tbl_name WHERE FIND_IN_SET('value',set_col)>0;
mysql> SELECT * FROM tbl_name WHERE set_col LIKE '%value%';
想要查找set值中是否存在某元素,同样可以通过如下方法:
# 查找set值中是否存在第一个元素'a'
mysql> SELECT * FROM tbl_name WHERE set_col & 1;
想要对set值进行精准比较,可以通过如下方法
# 在比较时,
# set_col='val1,val2'
# 和
# set_col='val2,val1'
# 的返回结果是不同的,在指定set值是元素值顺序应该按照定义set列时
# 指定的顺序
mysql> SELECT * FROM tbl_name WHERE set_col = 'val1,val2';