评论

收藏

[MySQL] 【MYSQL】 分区表

数据库 数据库 发布于:2021-07-03 21:57 | 阅读数:524 | 评论:0

  对于MYSQL的态度一直都是会基本SQL和简单命令就行,最近处理一个数据量很大的项目,为了提高效率,在数据库方面的瓶颈上,选择了使用分区表来提高查询效率。至此和大家一起分享一下。

  1.引言

  本文初略的讲述了mysql数据库如何分区表。

  

  2.环境要求

  在5.1版本中不是默认就安装了,而在之后版本中一般默认选择了安装分区表支持。可以通过如下方式查看当前数据库是否支持分区表操作:
DSC0000.jpg

  使用show variables like '%partition%';如果不支持分区,那么value字段值为No。

  

  3.重要概念描述

  3.1 分区字段

  1)当仅存在单一主键时,不存在唯一键,那么分区字段必须是主键字段;

  2)当存在复合主键时,不存在唯一键,那么分区字段必须是主键组合的一部分字段,一个或多个。

  3)当主键和唯一键都存在时,那么分区字段必须同时包括主键字段和唯一键字段。
  

  4.分区表类型
  4.1 range分区
  1)语法展示:
# 语法
# 在创建表单的最后,添加partitions by range(分区字段)(
#   partition 分区名 values less than(阀值1),
#   partition 分区名 values less than(阀值2),
#   ...
#   partition 分区名 values less than(阀值n),
# )
  示例展示:
create table test_range(
id int auto_increment,
description varchar(50),
primary key(id)
) ENGINE=InnoDB auto_increment=1 default charset=utf8
partition by range(id)(
partition p1 values less than(6), #id<6的存放在p1分区
partition p2 values less than(11) #6 <= id < 11 存放在p2分区
);
  查看分区情况:
show create table test_range;
DSC0001.jpg

  注意到,在显示的表结构添加了分区表的信息。

  数据测试:
insert into test_range values(null, "test1");  
  insert into test_range values(null, "test2");
  insert into test_range values(null, "test3");
  insert into test_range values(null, "test4");
  insert into test_range values(null, "test5");
  insert into test_range values(null, "test6");
  insert into test_range values(null, "test7");
  insert into test_range values(null, "test8");
  insert into test_range values(null, "test9");
  insert into test_range values(null, "test10");
  插入10条数据,此时我们来查看其查询执行过程:
DSC0002.jpg

  从结果可以发现,其只是在p1分区执行的查询,那么此时就减少了查询扫描的数据量,从而提高了查询效率。

  如果此时,我们插入第11条数据会发生什么情况呢?
insert into test_range values(null, "test11");
   会发错:insert into test_range values(null, "test11")Error Code: 1526. Table has no partition for value 110.015 sec
  原因很简单,因为在我们创建表单时,仅仅指定了1 - 10的id数值分区,当插入id=11时的分区时,此时没有分区提供,那么就引发错误,那么如果解决这样的问题呢,采取如下方式,修改表的分区方式:
alter table test_range add partition(
partition p3 values less than(MAXVALUE)
);
# 添加一个分区,也就是p3是id从11到maxValue的存放区域
  此时插入id=11的数据,并执行查询解析:

DSC0003.jpg     发现,已经将其分配到p3分区中了。

  还需要特别注意的时,使用partition by range(分区字段),其中的分区字段可以是分区字段的表单式,但是必须是返回的整数,在5.5版本中,可以使用partition by range column/columns语法,指定某个字段。这里不做介绍。大家可以自己尝试一下。

  

  4.2 list分区

  list分区可以理解为集合分区方式,意思就是指定某个集合来分区。

  语法展示:
partition by list(分区字段表达式)(
   partition 分区名 values in(value1, value2,...,valuen)#分区集合
   );
  示例展示:
create table test_list(
id int auto_increment,
description varchar(50),
primary key(id)
)ENGINE=InnoDB auto_increment=1 default charset=utf8
partition by list(id)(
partition p1 values in (1, 3, 5, 7, 9),#id=1,3,5,7,9分配至p1区
partition p2 values in (2, 4, 6, 8, 10)#id=2,4,6,8,10分配至p2区
);
#可以如4.1中使用show create table test_list查看表创建结构。
  数据测试:使用4.1中数据测试sql,插入10条数据。
DSC0004.jpg     可以发现其查询的仅仅是p1区。如果需要添加分区,可以使用4.1中使用的add partition来添加分区。

  

  4.3 hash分区

  使用hash函数得到取模,分配到不同的分区中。分区表达式必须返回整数。
  语法展示:
partition by hash(分区表达式) partitions 表数量(模数).
  示例展示:
create table test_hash(
id int auto_increment,
description varchar(50),
primary key(id)
) ENGINE=InnoDB auto_increment=1 default charset=utf8
partition by hash(id) partitions 3; #以id分区,分配到3张表中
  数据测试:插入4.1类同10条数据
DSC0005.jpg

  你也可以尝试修改id值,查看其分配的分区。hash分区还有一种叫做linear hash线性分区,这里不做介绍,

  

  4.4 key分区

  在本次开发中,我选择的是key分区,因为其是针对一个或多个字段作为分区字段,不要求是正整数,其内部调用的是自己的hash函数,计算出hash整数值,然后取模分表。

  语法展示:
partition by key(分区字段组合) partitions 表数(模数)。
  操作和Hash分区一致,这里就不做累赘的展示了。

  

  5.额外扩展

  5.1 在实际开发中,经常出现的情况是表已经上线使用,那么必须动态添加分区类型。
alter table 表名 partition by hash/key (分区字段表达式) [partitions 表数]#如果不加partitions那么默认为1.
   
   alter table 表名 partition by range/list(分区字段表达式)(具体分区设置)。
  5.2 当发现之前的分区需要添加新的分区时,采取如下方式:
list/range : alter table 表名 add partition (partition 分区名 [values in|values less than] [集合|数值]);
   hash/key : alter table 表名 add partition partitions 表数;
  例如:修改上述test_hash的分区数量
alter table test_hash add partition partitions 6;
  5.3 删除某个分区/删除所有分区
# 删除某个分区
   list/range : alter table 表名 drop partition 分区名1, 分区名2,...;
   #例如:
   alter table test_list drop partition p1;
   hash/key : 上述语法不成立
   
   # 删除整个分区
   alter table test_hash remove partitioning;
  还有诸如合并分区,以及5.5的一些新特性,list/range 增加column,columns支持。本文不做过多阐述。

  
关注下面的标签,发现更多相似文章