在集合中,作为数据分区划分依据的字段称为分区键。在范围分区方式中,分区键是用于划分数据范围的字段;在散列分区中,分区键是用于计算 hash 值的字段。每个分区键可以包含一个或多个字段。
在创建集合时可以指定分区类型和分区键,具体命令可参考创建集合。
使用范围分区方式进行数据分区时,分区键格式如下:
{ ShardingKey: { <字段1>: <1|-1>, [<字段2>: <1|-1>, ...] }, ShardingType: "range" }
范围分区方式的分区键一般选择具有序列性的字段,比如时间字段
> db.business.createCL( "orders", { ShardingKey: { create_date: 1 }, ShardingType: "range", Group: "group1" } )
使用散列分区方式做数据分区时,分区键格式如下:
{ ShardingKey: { <字段1>: <1>, [<字段2>: <1>, ...] }, ShardingType: "hash", Partition: <分区数> }
散列分区方式的分区键一般选择具有关键属性的字段,比如用户 id 字段
> db.business.createCL( "orders2", { ShardingKey: { id: 1 }, ShardingType: "hash", Partition: 4096, Group: "group1" } )
对于已经建好分区键的集合,可以通过快照命令查看分区键的定义及分区键划分情况
> db.snapshot( SDB_SNAP_CATALOG, { Name: "business.orders" } )
输出结果如下:
{ ... "Name": "business.orders", "ShardingKey": { "create_date": 1 }, "ShardingType": "range", "CataInfo": [ { "GroupID": 1000, "GroupName": "group1", "LowBound": { "create_date": { "$minKey": 1 } }, "UpBound": { "create_date": { "$maxKey": 1 } } } ] }