# 文件 ## 参数 ### 参数查看 mysql参数为键值对,可以通过`show variables`命令查看所有的数据库参数,并可以通过`like`来过滤参数名称。 除了`show variables`命令之外,还能够在`performance_schema`下的`global_variables`视图来查找数据库参数,示例如下: ```sql -- 查看innodb_buffer_pool_size参数 show variables like 'innodb_buffer_pool_size' ``` 上述`show variables`命令的执行结果为 | Variable\_name | Value | | :--- | :--- | | innodb\_buffer\_pool\_size | 4294967296 | ```sql select * from performance_schema.global_variables where variable_name like 'innodb_buffer_pool%'; ``` 上述sql的执行结果如下: | VARIABLE\_NAME | VARIABLE\_VALUE | | :--- | :--- | | innodb\_buffer\_pool\_chunk\_size | 134217728 | | innodb\_buffer\_pool\_dump\_at\_shutdown | ON | | innodb\_buffer\_pool\_dump\_now | OFF | | innodb\_buffer\_pool\_dump\_pct | 25 | | innodb\_buffer\_pool\_filename | ib\_buffer\_pool | | innodb\_buffer\_pool\_in\_core\_file | ON | | innodb\_buffer\_pool\_instances | 4 | | innodb\_buffer\_pool\_load\_abort | OFF | | innodb\_buffer\_pool\_load\_at\_startup | ON | | innodb\_buffer\_pool\_load\_now | OFF | | innodb\_buffer\_pool\_size | 4294967296 | ### 参数类型 mysql中的参数可以分为`动态`和`静态`两种类型, - 动态:动态参数代表可以在mysql运行过程中进行修改 - 静态:代表在整个实例的声明周期内都不得进行修改 #### 动态参数修改 对于动态参数,可以在运行时通过`SET`命令来进行修改,`SET`命令语法如下: ```sql set | [global | session] system_var_name=expr | [@@global. | @@session. | @@] system_var_name = expr ``` 在上述语法中,`global`和`session`关键字代表该动态参数的修改是针对`当前会话`还是针对`整个实例的生命周期`。 - 有些动态参数只能在会话范围内进行修改,例如`autocommit` - 有些参数修改后,实例整个生命周期内都会生效,例如`binglog_cache_size` - 有些参数既可以在会话范围内进行修改,又可以在实例声明周期范围内进行修改,例如`read_buffer_size` 使用示例如下: 查询read_buffer_size的global和session值 ```sql -- 查询read_buffer_size的global和session值 select @@session.read_buffer_size,@@global.read_buffer_size; ``` 返回结果为 | @@session.read\_buffer\_size | @@global.read\_buffer\_size | | :--- | :--- | | 131072 | 131072 | 设置@@session.read_buffer_size为524288 ```sql set @@session.read_buffer_size = 1024 * 512; ``` 设置后,再次查询read_buffer_size的global和session值,结果为 | @@session.read\_buffer\_size | @@global.read\_buffer\_size | | :--- | :--- | | 524288 | 131072 | 在调用set命令修改session read_buffer_size参数后,session参数发生变化,但是global参数仍然为旧的值。 > `set session xxx`命令并不会对global参数的值造成影响,新会话的参数值仍然为修改前的值。 之后,再对global read_buffer_size值进行修改,执行如下命令 ```sql set @@global.read_buffer_size = 496 * 1024; ``` 执行该命令后,sesion和global参数值为 | @@session.read\_buffer\_size | @@global.read\_buffer\_size | | :--- | :--- | | 524288 | 507904 | > `set global xxx`命令只会修改global参数值,对session参数值不会造成影响,新的session其`session参数值, global参数值`和修改后的global参数值保持一致 > 即使针对参数的global值进行了修改,其影响范围是当前实例的整个生命周期,`但是,其并不会对参数文件中的参数值进行修改,故而下次启动mysql实例时,仍然会从参数文件中取值,新实例的值仍然是修改前的值`。 > > 如果想要修改下次启动实例的参数值,需要修改参数文件中该参数的值。(参数文件路径通常为`/etc/my.cnf`) #### 静态参数修改 在运行时,如果尝试对静态参数进行修改,那么会发生错误,示例如下: ```sql > set global datadir='/db/mysql' [2025-01-30 15:05:17] [HY000][1238] Variable 'datadir' is a read only variable ``` ## 日志文件 mysql中常见日志文件如下 - 错误日志(error log) - 二进制日志(binlog) - 慢查询日志(slow query log) - 查询日志(log) ### 错误日志 错误日志针对mysql的启动、运行、关闭过程进行了记录,用户可以通过`show variables like 'log_error';`来获取错误日志的路径: ```sql show variables like 'log_error'; ``` 其输出值如下: | Variable\_name | Value | | :--- | :--- | | log\_error | /var/log/mysql/mysqld.log | 当mysql数据库无法正常启动时,应当首先查看错误日志。 ### 慢查询日志 慢查询日志存在一个阈值,通过`long_query_time`参数来进行控制,该参数默认值为`10`,代表慢查询的限制为10s。 通过`slow_query_log`参数,可以控制是否日志输出慢查询日志,默认为`OFF`,如果需要开启慢查询日志,需要将该值设置为`ON`。 关于慢查询日志的输出地点,可以通过`log_output`参数来进行控制。该参数默认为`FILE`,支持`FILE, TABLE, NONE`。`log_output`支持制定多个值,多个值之间可以通过`,`分隔,当值中包含`NONE`时,以`NONE`优先。 #### log_queries_not_using_indexes 当`log_queryies_not_using_indexes`开启时,如果运行的sql语句没有使用索引,那么这条sql同样会被输出到慢查询日志。该参数默认关闭。 `log_throttle_queries_not_using_idnexes`用于记录`每分钟允许记录到慢查询日志并且没有使用索引`的sql语句次数,该参数值默认为0,代表每分钟输出到慢查询日志中的数量没有限制。 该参数主要用于防止大量没有使用索引的sql添加到慢查询日志中,造成慢查询日志大小快速增加。 当慢查询日志中的内容越来越多时,可以通过mysql提供的工具`mysqldumpslow`命令,示例如下: ```sql mysqldumpslow -s at -n 10 ${slow_query_log_path} ``` ### 查询日志 查询日志记录了对mysql数据库所有的请求信息,无论请求是否正确执行。 查询日志通过`general_log`参数来进行控制,默认该参数值为`OFF`. ### 二进制日志 二进制日志(binary log)记录了针对mysql数据库执行的所有更改操作(不包含select以及show这类读操作)。 对于update操作等,即使没有对数据库进行修改(affected rows为0),也会被写入到binary log中。 二进制日志的主要用途如下: - 恢复(recovery):某些数据恢复需要二进制日志,例如在数据库全备份文件恢复后,用户可以通过二进制日志进行point-in-time的恢复 - 复制(replication):通过将一台主机(master)的binlog同步到另一台主机(slave),并且在另一台主机上执行该binlog,可以令slave与master进行实时同步 - 审计(audit):用户可以对binlog中的信息进行审计,判断是否存在对数据库进行的注入攻击 通过参数`log_bin`可以控制是否启用二进制日志。 binlog通常存放在`datadir`参数所指定的目录路径下。在该路径下,还存在`binlog.index`文件,该文件为binlog的索引文件,文件内容包含所有binlog的文件名称。 #### max_binlog_size `max_binlog_size`参数控制单个binlog文件的最大大小,如果单个文件超过该值,会产生新的二进制文件,新binlog的后缀会+1,并且新文件的文件名会被记录到`.index`文件中。 `max_binlog_size`的默认值大小为`1G`。 #### binlog_cache_size 当使用innodb存储引擎时,所有未提交事务的binlog会被记录到缓存中,等到事务提交后,会将缓存中的binlog写入到文件中。缓存大小通过`binlog_cache_size`决定,该值默认为`32768`,即`32KB`。 `binlog_cache_size`是基于会话的,`在每个线程开启一个事务时,mysql会自动分配一个大小为binlog_cache_size大小的缓存,因而该值不能设置过大`。 当一个事务的记录大于设定的`binlog_cache_size`时,mysql会将缓冲中的日志写入到一个临时文件中,故而,该值无法设置过小。 通过`show global status like 'binlog_cache%`命令可以查看`binlog_cache_use`和`binlog_cache_disk_use`的状态,可以通过上述两个状态判断binlog cache大小是否合适。 ##### binlog_cache_use `binlog_cache_use`记录了使用缓冲写binlog的次数 ##### binlog_cache_disk_use `binlog_cache_disk_use`记录了使用临时文件写二进制日志的次数 #### sync_binlog `sync_binlog`参数控制mysql server同步binlog到磁盘的频率,该值默认为`1` - 0: 如果参数值为0,代表mysql server禁用binary log同步到磁盘。mysql会依赖操作系统将binary log刷新到磁盘中,该设置性能最佳,但是遇到操作系统崩溃时,可能会出现mysql事务提交但是还没有同步到binary log的场景 - 1: 如果参数值设置为1,代表在事务提交之前将binary log同步到磁盘中,该设置最安全,但是会增加disk write次数,对性能会带来负面影响。在操作系统崩溃的场景下,binlog中缺失的事务还只处于prepared状态,从而确保binlog中没有事务丢失 - N:当参数值被设置为非`0,1`的值时,每当n个binlog commit groups被收集到后,同步binlog到磁盘。在这种情况下,可能会发生事务提交但是还没有被刷新到binlog中,`当n值越大时,性能会越好,但是也会增加数据丢失的风险` 为了在使用innodb事务和replciation时获得最好的一致性和持久性,请使用如下设置: ```cnf sync_binlog=1 innodb_flush_log_at_trx_commit=1 ``` #### innodb_flush_log_at_trx_commit innodb_flush_log_at_trx_commit用于控制redo log的刷新。 该参数用于平衡`commit操作ACID的合规性`以及`更高性能`。通过修改该参数值,可以实现更佳的性能,但是在崩溃时可能会丢失事务: - 1: 1为该参数默认值,代表完全的ACID合规性,日志在每次事务提交后被写入并刷新到磁盘中 - 0: 日志每秒被写入和刷新到磁盘中,如果事务没有被刷新,那么日志将会在崩溃中被丢失 - 2: 每当事务提交后,日志将会被写入,并且每秒钟都会被刷新到磁盘中。如果事务没有被刷新,崩溃同样会造成日志的丢失 如果当前数据库为slave角色,那么其不会把`从master同步的binlog`写入到自己的binlog中,如果要实现`master=>slave=>slave`的同步架构,必须设置`log_slave_updates`参数。 #### binlog_format binlog_format用于控制二进制文件的格式,可能有如下取值: - statement: 二进制文件记录的是日志的逻辑sql语句 - row:记录表的行更改情况,默认值为`row` - mixed: 如果参数被配置为mixed,mysql默认会采用`statement`格式进行记录,但是在特定场景能够下会使用`row`格式: - 使用了uuid, user, current_user,found_rows, row_count等不确定函数 - 使用了insert delay语句 - 使用了用户自定义函数 - 使用了临时表 ##### 使用statement可能会存在的问题 在使用statement格式时,可能会存在如下问题 - master运行rand,uuid等不确定函数时,或使用触发器操作时,会导致主从服务器上的数据不一致 - innodb的默认事务隔离级别为`repetable_read`,如果使用`read_commited`级别时,statement格式可能会导致丢失更新的情况,从而令master和slave的数据不一致 binlog为动态参数,可以在数据库运行时进行修改,并且可以针对session和global进行修改。 #### mysqlbinlog 在查看二进制日志时,可以使用`mysqlbinlog`命令,示例如下 ```bash mysqlbinlog --start-position=203 ${binlog_path} ``` ## pid文件 mysql实例启动时,会将进程id写入到一个文件中,该文件被称为pid文件。 pid文件路径通过`pid_file`参数来进行控制,fedora中默认路径为`/run/mysqld/mysqld.pid`。 ## 表结构定义文件 mysql中数据的存储是根据表进行的,每个表都有与之对应的文件。无论表采用何种存储引擎,都会存在一个以`frm`为后缀的文件,该文件中保存了该表的表结构定义。 > mysql 8中,schema对应目录下不再包含frm文件。 ## 表空间文件 innodb采用将存储的数据按照表空间(tablespace)进行存放的设计。在默认配置下,将会有一个初始大小为10MB,名称为ibdata1的文件,该文件为默认的表空间文件。 ### innodb_data_file_path 可以通过`innodb_data_file_path`参数对默认表空间文件进行设置,示例如下: ```sql innodb_data_file_path=datafile_spec1[;datafile_spec2]... ``` 用户可以通过多个文件组成一个表空间,示例如下: ```sql innodb_data_file_path=/db/ibdata1:2000M;/dr2/db/ibdata2:2000M;autoextend ``` 在上述配置中,表空间由`/db/ibdata1`和`/dr2/db/ibdata2`两个文件组成,如果两个文件位于不同的磁盘上,那么磁盘的负载将会被平均,数据库的整体性能将会被提高。 同时,在上述示例中,为两个文件都指定了后续属性,含义如下: - ibdata1:文件大小为2000M - ibdata2:文件大小为2000M,并且当文件大小被用完后,文件会自动增长 当`innodb_data_file_path`被设置后,所有基于innodb存储引擎的表,其数据都会记录到该共享表空间中。 ### innodb_file_per_table 如果`innodb_file_per_table`被启用后(默认启用),则每个基于innodb存储引擎的表都可以有一个独立的表空间,独立表空间的命名规则为`表名+.ibd`。 通过innodb_file_per_table,用户不需要将所有的数据都放置在默认的表空间中。 > `innodb_file_per_table`所产生的独立表空间文件,其仅存储该表的数据、索引和插入缓冲BITMAP信息,其余信息仍然存放在默认的表空间中。 ## redo log文件 redo log是一个基于磁盘的数据结构,用于在crash recovery过程中纠正由`未完成事务写入的错误数据`。 > 在一般操作中,redo log对那些`会造成表数据发生改变的请求`进行encode操作,请求通常由sql statement或地级别api发起。 redo log通常代表磁盘上的redo log file。写入重做日志文件的数据通常基于受影响的记录进行编码。在数据被写入到redo log file中时,LSN值也会不断增加。 ### 循环写入 innodb会按顺序写入redo log文件,例如redo log file group中存在两个文件,innodb会先写文件1,文件1写满后会切换文件2,在文件2写满后,重新切换到文件1。 ### redo log capacity 从mysql 8.0.30开始,`innodb_redo_log_capacity`参数用于控制redo log file占用磁盘空间的大小。该参数可以在实例启动时进行设置,也可以通过`set global`来进行设置。 `innodb_redo_log_capacity`默认值为`104857600`,即`100M`。 redo log文件默认位于`datadir`路径下的`#innodb_redo`目录下。innodb会尝试维护32个redo log file,每个redo log file文件大小都相同,为`1/32 * innodb_redo_log_capacity`。 redo log file将会使用`#ib_redoN`的命名方式,`N`是redo log file number。 innodb redo log file分为如下两种: - ordinary:正在被使用的redo log file - spare:等待被使用的redo log file > 相比于ordinary redo log file,spare redo log file的名称中还包含了`_tmp`后缀 每个oridnary redo log file都关联了一个制定的LSN范围,可以通过查询`performance_schema.innodb_redo_log_files`表里获取LSN范围。 示例如下: ```sql select file_name, start_lsn, end_lsn from performance_schema.innodb_redo_log_files; ``` 查询结果示例如下: | file\_name | start\_lsn | end\_lsn | | :--- | :--- | :--- | | ./#innodb\_redo/#ib\_redo6 | 19656704 | 22931456 | 当执行checkpoint时,innodb会将checkpoint LSN存储在文件的header中,在recovery过程中,所有的redo log文件都将被检查,并且基于最大的LSN来执行恢复操作。 常用的redo log状态如下 ```bash # resize operation status Innodb_redo_log_resize_status # 当前redo log capacity Innodb_redo_log_capacity_resized Innodb_redo_log_checkpoint_lsn Innodb_redo_log_current_lsn Innodb_redo_log_flushed_to_disk_lsn Innodb_redo_log_logical_size Innodb_redo_log_physical_size Innodb_redo_log_read_only Innodb_redo_log_uuid ``` > 重做日志大小设置时,如果设置大小过大,那么在执行恢复操作时,可能需要花费很长时间;如果重做日志文件大小设置过小,可能会导致事务的日志需要多次切换重做日志文件。 > > 此外,重做日志太小会频繁发生async checkpoint,导致性能抖动。重做日志存在一个capacity,代表了最后的checkpoint不能够超过这个阈值,如果超过必须将缓冲区中的部分脏页刷新到磁盘中,此时可能会造成用户线程的阻塞。 ### redo log和binlog的区别 #### 记录内容 binlog记录的是一个事务的具体操作内容,该日志为逻辑日志。 而innodb redo log记录的是关于某个页的修改,为物理日志。 #### 写入时机 binlog仅当事务提交前才进行提交,即只会写磁盘一次。 redo log则是在事务运行过程中,不断有重做日志被写入到redo log file中。 ### redo log写入时机 - master thread会每秒将redo log从buffer中刷新到redo log ile中,不露内事务是否已经提交 - innodb_flush_log_at_trx_commit控制redo log的刷新时机,默认情况下,在事务提交前会将数据从redo log buffer刷新到redo log file中