用户做数据分区时需要进行分区配置,配置的主要内容包括划分每个分区包含的数据范围,以及指定分区的归属。
假设用户需要在集合 business.orders_2019 中以 id 字段为分区键,将数据均匀切分到两个复制组 prod_part1 和 prod_part2 中。则相应的切分配置如下表:
分区范围 | 分区所属复制组 | 说明 |
---|---|---|
[0, 2048) | prod_part1 | id 字段 hash 值范围在 0~2048 范围内的记录切分到复制组 prod_part1 中 |
[2048, 4096) | prod_part2 | id 字段 hash 值范围在 2048~4096 范围内的记录切分到复制组 prod_part2 中 |
Note:
对集合 business.orders_2019 进行散列分区,默认情况下 hash 值范围为[0, 4096)
以下根据配置,实际生成集合 business.orders_2019
创建集合 business.orders_2019 ,分区键为 id 字段,分区方式为散列分区(hash),集合所在复制组为 prod_part1
> db.createCS( "business" ) > db.business.createCL( "orders_2019", { ShardingKey: { id: 1 }, ShardingType: "hash", Group: "prod_part1" } )
执行切分操作,将集合 business.orders_2019 中 id 字段 hash 值范围在[2048, 4096)的记录,从复制组 prod_part1 切分至复制组 prod_part2
> db.business.orders_2019.split( "prod_part1", "prod_part2", { id: 2048}, { id: 4096} )
通过快照命令查看分区的划分情况
> db.snapshot( SDB_SNAP_CATALOG, { Name: "business.orders_2019" } )
输出结果如下:
{ ... "Name": "business.orders_2019", "ShardingType": "hash", "ShardingKey": { "id": 1 } "Partition": 4096, "CataInfo": [ { "ID": 0, "GroupID": 1000, "GroupName": "prod_part1", "LowBound": { "": 0 }, "UpBound": { "": 2048 } }, { "ID": 1, "GroupID": 1001, "GroupName": "prod_part2", "LowBound": { "": 2048 }, "UpBound": { "": 4096 } } ] }
当用户需要将集合 business.orders 以 create_date 字段按年将数据切分到不同的子集合中,相应的切分配置如下表:
分区范围 | 分区所属子集合 | 说明 |
---|---|---|
[201801, 201901) | business.orders_2018 | create_date 在 201801 到 201901 范围内的数据切分到子集合 business.orders_2018 |
[201901, 202001) | business.orders_2019 | create_date 在 201901 到 202001 范围内的数据切分到子集合 business.orders_2019 |
以下根据配置,实际生成集合 business.orders
创建集合 business.orders ,指定为主集合,分区键为 create_date 字段,分区方式为范围分区(range)
> db.business.createCL( "orders", { IsMainCL: true, ShardingKey: { create_date: 1 }, ShardingType: "range" } )
通过挂载操作,将主集合 business.orders 和两个子集合进行关联
> db.business.orders.attachCL( "business.orders_2018", { LowBound: { create_date: "201801" }, UpBound: { create_date: "201901" } } ) > db.business.orders.attachCL( "business.orders_2019", { LowBound: { create_date: "201901" }, UpBound: { create_date: "202001" } } )
Note:
business.orders_2018 和 business.orders_2019 可以是普通集合,也可以是数据库分区的集合。
用户可以通过快照命令查看分区的划分情况:
db.snapshot( SDB_SNAP_CATALOG, { Name: "business.orders" } )
输出结果如下:
{ ... "Name": "business.orders", "IsMainCL": true, "ShardingType": "range", "ShardingKey": { "create_date": 1 } "CataInfo": [ { "ID": 1, "SubCLName": "business.orders_2018", "LowBound": { "create_date": "201801" }, "UpBound": { "create_date": "201901" } }, { "ID": 2, "SubCLName": "business.orders_2019", "LowBound": { "create_date": "201901" }, "UpBound": { "create_date": "202001" } } ] }