MySQ-存储引擎

注意：所有文章除特别说明外，转载请注明出处.

数据库与实例

数据库的概述：

简单说就是存放数据的仓库，这个仓库按一定的数据结构（数据的组织形式、或数据之间的联系）来组织和存储的，数据库分为关系型数据库（Oracle，MySQL，SQLServer）和非关系型数据库（NOSQL，Memcaced，redis等）

实例

MySQL实例是由线程和内存组成，它是真正用于操作数据库文件的，一般情况下一个实例操作一个或多个数据库，在实例启动的时候MySQL会读取配置文件，MySQL如果找不到配置文件则会按照默认参数设置启动实例

锁

只要由多个查询需要在同一时刻修改数据，都会产生并发控制问题，解决方法：并发控制

读写锁

共享锁：读锁，它是共享的，互相不阻塞，多个用户在同一时刻可以读取同一个资源且互不干扰
排他锁：写锁，它会阻塞其他的写锁和读锁，写锁比读锁具有更高的优先级

锁策略

表锁：它是mysql中最基本的锁策略，并且开销最小，锁定整张表
行锁：最大程度支持并发处理，InnoDB就使用了行锁，但它的行锁不是那么简单（后续讲）

事务

==实现了ACID，会需要更强的cpu处理能力，更大的内存和更大的磁盘空间==

原子性Atomicity：一个事务被视为一个不可分割的最小工作单元，整个事务的操作要么全部成功，要么全部失败
一致性consistency：就是一个事务没有提交commit，系统崩溃，那么事务中所做的修改不会保存到数据库中
隔离性isolation：一个事务所作的操作在提交之前，对其他事务是不可见的
持久性durability：一旦事务提交，所做的修改就会永久保存到数据库中，即使系统崩溃，改的数据也不会丢失

MySQL==默认采用自动提交==AUTOCOMMIT模式，如果不是显示开始一个事务，每个查询都会被当作一个事务执行提交操作，可通过AUTOCOMMIT变量来启用或禁用自动提交模式

InnoDB

它是一个存储引擎，用来==负责mysql中的数据的存储和提取==，不会去解析SQL，但是会解析外键定义，它的数据都存储在表空间中tablespace，由一系列的数据文件组成，它采用MVCC来支持高并发，实现了四个标准的隔离级别，默认级别是：==REPEATABLE READ（可重复度读）==

InnoDB的表是基于==聚簇索引==建立的

表空间（tablespace）是存储引擎中最高的存储逻辑单位，在表空间的下面又包括段（segment）、区（extent）、页（page），表空间中的页大小都为 16KB，每个 16KB 大小的页中可以存放 2200 行的记录，对nnodb_page_size 选项对默认大小进行修改，需要注意的是不同的页大小最终也会导致区大小的不同

表的定义和数据索引等信息分开存储，其中表的定义存储在 .frm文件中，数据索引储在 .ibd 文件中

在InnoDB中，它为每行记录都增加了三个隐藏的字段

事务id：6字节
回滚指针：7字节
隐藏的id

为了支持事务，引入如下概念：

redo log：保存执行的SQL语句，当MySQL执行recovery时重新执行redo log记录里面的sql操作就好，当客户端每执行一个sql时，先被写到log buffer，当执行commit时，log buffer再被视情况刷新到磁盘

undo log：主要是用来回滚，就是复制事务前的数据库内容到undo buffer，再合适的时间undo buffer中的内容刷新到磁盘，它两都是环形缓冲，undo buffer均放在ibd数据文件（表空间）中，undo log被划分为多个段，具体某行的undo log就保存在某段，即回滚段

当事务1更改此行的值时，会进行如下操作：

用排他锁锁定该行

记录redo log

把改行修改前的值copy到undo log

修改当前行的值，填写事务编号，使用回滚指针指向undo log中的修改前的行

当有多行修改记录时，通过回滚指针连在一起，可通过当前指针的回滚指针回溯，InnoDB的purge线程，它会查询比现在最老的活动事务还早道德undo log，删除它们

隔离级别

未提交读：就是脏读，事务的修改即使没有提交，对其他事务都是可见的，事务可以读取未提交的数据
提交读：一个事务所作的操作在提交之前，对其他事务是不可见的，即不可重复读（隔离性）
==可重复读==：解决了脏读，该级别保证在同一个事务中多次读取同样的结果是一致的，但是它解决不了幻读，幻读即在读取数据的时候，另一个事务又插入了新的记录，当之前事务再次读取时，产生了幻行，InnoDB的通过MVCC解决了幻读
可串行化：最高的级别，强制事务串行执行，避免了幻读，采用行锁

显示隐式锁

采用两阶段锁定协议，在事务执行过程中，随时都能锁，锁只有在执行commit或rollback时才会被释放，所有锁在同一时刻被释放，这是隐式锁定，InnoDB会根据隔离级别自动加锁

MVCC实现方式

它是行级锁的一个变种，通过保存数据在某个时间点的快照来实现，更新前建立undo log，根据各种策略读取时非阻塞就是MVCC，每行数据都存在一个版本，每次数据更新时都会更新该版本，各个事务之间无干扰；保存时比较版本号，成功则覆盖，失败则rollback，在默认隔离级别下，MVCC的具体操作(innoDB)： ==InnoDB的MVCC通过在每行记录后面保存两个隐藏的列来实现，一个保存创建时间，一个保存删除时间==

select：查找版本早于或=当前事务版本的数据行，确保读取的行在事务开始之前就已经存在，要么是事务自己插入的
insert：为插入的每一行保存当前系统版本号
delete删除每一行保存当前系统版本号为行删除标志
update：保存当前系统版本号，同时保存当前系统版本号到原来的行作为行删除标志

InnoDB并没有实现核心的饿多版本共存，undo log里面的内容只是串行化的结果，不属于多版本共存，当事务影响到多行数据时，MVCC就无能为力，InnoDB只是提供读的非阻塞而已

InnoDB缓存池

缓存索引、缓存行的数据、自适应哈希索引、插入缓冲、锁以及内部数据结构，使用缓存池可以延迟写入，就是合并多个写入操作，然后一起顺序写回，InnoDB严重依赖缓存池

innodb相关磁盘文件：

- ibdata1:
- - 回滚段
  - 表元数据
  - double write
  - insert buffer dump等
- ib_logfile0/1
- .frm:表定义文件
- .ibd:数据文件,innodb_file_per_table=1
性能相关参数：
innodb_log_file_size
innodb_log_files_in_group
原因：当redo log 采用轮寻范式ib_logfile0写完，写ib_logfile1完,清楚ib_logfile0并继续写入ib_logfile0;当ib_logfile1写完，ib_logfile0中还有数据没有持久化到磁盘，又来了新的写入，此时会阻塞新写入，强制刷新ib_logfile0到磁盘，再将新写，写入ib_logfile0;这样就是说，logfile越大其写入越不容易阻塞，写入性能也就越好。
数据节点每页16K
innodb数据块缓存池
数据读写经过缓存池
- 数据以整页为单位读取
- LRU策略（最少使用）换出，
innodb数据持久化：通过事务日志
innodb_flush_log_at_trx_commit
- 0：每秒写入并持久化一次（不安全，性能高，无论mysql或服务器宕机，都会丢数据），延迟写
- 1：每次commit都持久化（安全，性能低，IO负担重），实时写，实时刷
- 2：每次commit都写入内存的redo log缓存，每秒再刷新到磁盘（安全，性能折中，mysql宕机数据不会丢失，服务器宕机数据会丢失），实时写，延时刷
事务日志
通过事务日志来减少提交事务时的开销，因为事务修改的数据和索引通常会映射到表空间的随机位置，这样刷新到磁盘需要很多随机IO，InnoDB用日志把随机变为顺序，InnoDB最后还是把变更写到数据文件，日志有固定的大小，它以环形方式写入，写到日志尾部时，会重新跳到头部开始，不会覆盖还没有写入到数据文件的日志记录

InnoDB变更任何数据时，会写一条变更记录到内存日志缓冲区，在缓冲区满的时候或事务提交的时候，InnoDB都会刷写缓冲区的内容到磁盘日志文件，它默认通过一个后台线程来写脏页，并且会合并写入，更有效地顺序写出到磁盘

要修改日志文件大小，就要完全关闭MySQL，将旧的日志文件移到其他地方，重新配置参数，然后重启

InnoDB刷新日志缓存
当它把日志缓冲刷新到磁盘日志文件上时，会使用一个Mutex锁住缓冲区，InnoDB有一个group Commit功能，可以在一个IO操作中提交多个事务，

日志缓冲文件写到日志文件：就是简单地把数据从InnoDB的内存缓冲转移到操作系统的缓存，即内存，并没有真正持久化

把日志刷新到持久化缓存：这是一个阻塞IO的调用，将缓存刷出缓存，并确认写到磁盘中，直到数据被完全写回才会完成

双写缓存
InnoDB用双写缓存来避免当页没有写完整所导致的数据损坏，保证了数据完整性

当InnoDB从缓存池刷新页面到磁盘时，会先把它们放在双写缓冲（顺序的，只调用一次fsync()），然后再写到其所属的数据区域，保证每个页面的写入都是完整的并且是持久化的

如果一个不完整的页写到了双写缓存，InnoDB恢复时，用原始页面替换掉这个损坏页面

如果页的真实位置损坏了，InnoDB恢复时，用双写缓存的页面替换掉这个损坏页面，在每个页面末尾都会有一个校验值，能知道它什么时候损坏

innodb关键特性
插入缓冲（insert buffer）
两次写（Double write）
自适应哈希索引（adaptive hash index）
异步io（Async IO）
刷新领接页（Flush Neighbor Page）

数据库与实例

数据库的概述：

实例

锁

读写锁

锁策略

事务

InnoDB

在InnoDB中，它为每行记录都增加了三个隐藏的字段

当事务1更改此行的值时，会进行如下操作：

隔离级别

显示隐式锁

MVCC实现方式

InnoDB缓存池

innodb相关磁盘文件：

性能相关参数：

innodb数据持久化：通过事务日志

事务日志

InnoDB刷新日志缓存

双写缓存

innodb关键特性