必看的数据库使用规范

服务器

浏览数:168

2019-6-1

AD:资源代下载服务

导读: 
关于MySQL数据库规范,相信大家多少看过一些文档。本篇文章给大家详细分类总结了数据库相关规范,从库表命名设计规范讲起,到索引设计规范,后面又给出SQL编写方面的建议。相信这些规范适用于大多数公司,也希望大家都能按照规范来使用我们的数据库,这样我们的数据库才能发挥出更高的性能。

关于库:

  1. 【强制】库的名称必须控制在32个字符以内,英文一律小写。
  2. 【强制】库的名称格式:业务系统名称_子系统名。
  3. 【强制】库名只能使用英文字母,数字,下划线,并以英文字母开头。
  4. 【强制】创建数据库时必须显式指定字符集,并且字符集只能是utf8或者utf8mb4。创建数据库SQL举例:Create database db1 default character set utf8;
  5. 【建议】临时库、表名以tmp_ 为前缀,并以日期为后缀,备份库、表以 bak_ 为前缀,并以日期为后缀。

关于表

  1. 【强制】表和列的名称必须控制在32个字符以内,表名只能使用字母、数字和下划线,一律小写。
  2. 【强制】表名要求模块名强相关,同一模块使用的表名尽量使用统一前缀。
  3. 【强制】创建表时必须显式指定字符集为utf8或utf8mb4。
  4. 【强制】列名尽量不用关键字(如type,order等)。
  5. 【强制】创建表时必须显式指定表存储引擎类型,如无特殊需求,一律为InnoDB。
  6. 【强制】建表必须有comment。
  7. 【强制】对于超过100W行的大表进行alter table,必须经过DBA审核,并在业务低峰期执行,多个alter需整合在一起。
    因为alter table会产生表锁,期间阻塞对于该表的所有写入,对于业务可能会产生极大影响。
  8. 【建议】建表时关于主键:表必须有主键
    (1)强制要求主键为id,类型为int或bigint,且为auto_increment 建议使用unsigned无符号型。

    (2)标识表里每一行主体的字段不要设为主键,建议设为其他字段如user_id,order_id等,并建立unique key索引。
    因为如果设为主键且主键值为随机插入,则会导致innodb内部page分裂和大量随机I/O,性能下降。

  9. 【建议】核心表(如用户表)必须有行数据的创建时间字段create_time和最后更新时间字段update_time,便于查问题。
  10. 【建议】表中所有字段尽量都是NOT NULL属性,业务可以根据需要定义DEFAULT值。
    因为使用NULL值会存在每一行都会占用额外存储空间、数据迁移容易出错、聚合函数计算结果偏差等问题。
  11. 【建议】中间表用于保留中间结果集,名称必须以tmp_ 开头。备份表用于备份或抓取源表快照,名称必须以bak_开头。中间表和备份表定期清理。
  12. 【示范】一个较为规范的建表语句:

    CREATE TABLE user_info (
      `id` int unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主键',
      `user_id` bigint(11) NOT NULL COMMENT '用户id',
      `username` varchar(45) NOT NULL COMMENT '真实姓名',
      `email` varchar(30) NOT NULL COMMENT '用户邮箱',
      `nickname` varchar(45) NOT NULL COMMENT '昵称',
      `birthday` date NOT NULL COMMENT '生日',
      `sex` tinyint(4) DEFAULT '0' COMMENT '性别',
      `short_introduce` varchar(150) DEFAULT NULL COMMENT '一句话介绍自己,最多50个汉字',
      `user_resume` varchar(300) NOT NULL COMMENT '用户提交的简历存放地址',
      `user_register_ip` int NOT NULL COMMENT '用户注册时的源ip',
      `create_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '创建时间',
      `update_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '修改时间',
      `user_review_status` tinyint NOT NULL COMMENT '用户资料审核状态,1为通过,2为审核中,3为未通过,4为还未提交审核',
      PRIMARY KEY (`id`),
      UNIQUE KEY `uniq_user_id` (`user_id`),
      KEY `idx_username`(`username`),
      KEY `idx_create_time_status`(`create_time`,`user_review_status`)
    ) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='网站用户基本信息'

关于索引

  1. 【强制】InnoDB表必须主键为id int/bigint auto_increment,且主键值禁止被更新。
  2. 【强制】InnoDB和MyISAM存储引擎表,索引类型必须为BTREE。
  3. 【建议】主键的名称以 pk_ 开头,唯一键以 uniq_uk_ 开头,普通索引以 idx_ 开头,一律使用小写格式,以字段的名称或缩写作为后缀。
  4. 【建议】单个表上的索引个数不能超过8个。
  5. 【建议】在建立索引时,多考虑建立联合索引,并把区分度最高的字段放在最前面。如列userid的区分度可由select count(distinct userid)计算出来。
  6. 【建议】在多表join的SQL里,保证被驱动表的连接列上有索引,这样join执行效率最高。
  7. 【建议】建表或加索引时,保证表里互相不存在冗余索引。
    对于MySQL来说,如果表里已经存在key(a,b),则key(a)为冗余索引,需要删除。

SQL编写

  1. 【强制】程序端SELECT语句必须指定具体字段名称,禁止写成 *。
  2. 【强制】程序端insert语句指定具体字段名称,不要写成insert into t1 values(…)。
  3. 【强制】除静态表或小表(100行以内),DML语句必须有where条件,且使用索引查找。
  4. 【强制】where条件里等号左右字段类型必须一致,否则无法利用索引。
  5. 【强制】WHERE 子句中禁止只使用全模糊的LIKE条件进行查找,必须有其他等值或范围查询条件,否则无法利用索引。
  6. 【强制】索引列不要使用函数或表达式,否则无法利用索引。如where length(name)=’Admin’或where user_id+2=10023。
  7. 【建议】insert into…values(XX),(XX),(XX).. 这里XX的值不要超过5000个。
    值过多虽然上线很很快,但会引起主从同步延迟。
  8. 【建议】SELECT语句不要使用UNION,推荐使用UNION ALL,并且UNION子句个数限制在5个以内。
    因为union all不需要去重,节省数据库资源,提高性能。
  9. 【强制】禁止跨db的join语句。
  10. 【建议】不建议使用子查询,建议将子查询SQL拆开结合程序多次查询,或使用join来代替子查询。
  11. 【建议】线上环境,多表join不要超过5个表。
  12. 【建议】在多表join中,尽量选取结果集较小的表作为驱动表,来join其他表。
  13. 【建议】批量操作数据时,需要控制事务处理间隔时间,进行必要的sleep。
  14. 建议】事务里包含SQL不超过5个
    因为过长的事务会导致锁数据较久,MySQL内部缓存、连接消耗过多等问题。
  15. 【建议】事务里更新语句尽量基于主键或unique key,如update … where id=XX;
    否则会产生间隙锁,内部扩大锁定范围,导致系统性能下降,产生死锁。
  16. 【建议】减少使用order by,和业务沟通能不排序就不排序,或将排序放到程序端去做。Order by、group by、distinct这些语句较为耗费CPU,数据库的CPU资源是极其宝贵的。
  17. 【建议】order by、group by、distinct这些SQL尽量利用索引直接检索出排序好的数据。如where a=1 order by b可以利用key(a,b)。
  18. 【建议】包含了order by、group by、distinct这些查询的语句,where条件过滤出来的结果集请保持在1000行以内,否则SQL会很慢。

作者:kunjian