Cloud Firestore 中的索引类型

索引是决定数据库性能的一个重要因素。就像书的索引可以将书中的主题映射到页码一样,数据库中的索引可以将数据库中的数据项映射到数据库中的位置。当您查询数据库时,数据库可以使用索引来快速确定您请求的项目的位置。

本页面介绍了 Cloud Firestore 使用的两种索引类型:单字段索引复合索引

索引定义和结构

索引是在给定文档的字段列表上定义的,每个字段都有相应的索引模式

对于索引定义中指定的每个字段,索引都会包含一个相应的条目。索引包含根据索引进行查询时,可能会出现在结果中的所有文档。只有当针对索引中使用的每个字段,文档都设置有索引值时,该文档才会包含在索引中。如果文档没有为索引定义所引用的字段设置值,该文档便不会出现在索引中。在这种情况下,基于索引的所有查询都不会将该文档作为结果返回。

复合索引按字段值以索引定义中指定的顺序进行排序。

每个查询的背后都有索引在发挥作用

如果查询没有索引,大部分数据库将需要一项一项地查找需要的内容,这个过程非常缓慢,并且随着数据库内容的增加,查询速度会越来越慢。 为了确保提供高查询性能,Cloud Firestore 会为所有查询使用索引。这样一来,查询的性能将取决于结果集的大小,而不是数据库中的条目数量。

减少索引管理,专注应用开发

Cloud Firestore 的功能可减少管理索引所需的时间,它会自动为您创建最基本的查询所需的索引。在您使用并测试应用的过程中,Cloud Firestore 会帮助您识别并创建您的应用所需的其他索引

索引类型

Cloud Firestore 使用了两种索引类型:单字段索引和复合索引。除了编入索引的字段数量不同之外,单字段索引和复合索引的管理方式也不同。

单字段索引

单字段索引会为一个集合中包含某个特定字段的所有文档存储一个映射,并按顺序对其排序。单字段索引中的每个条目会记录文档中一个特定字段的值,以及该文档在数据库中的位置。Cloud Firestore 使用这些索引来执行许多基本的查询。您可以通过配置数据库的自动索引设置和索引例外项来管理单字段索引。

自动编入索引

默认情况下,Cloud Firestore 会自动为文档中的每个字段和映射 (map) 中的每个子字段维护单字段索引。Cloud Firestore 对单字段索引使用以下默认设置:

  • 对于每个既非数组也非映射的字段,Cloud Firestore 会定义两个集合范围的单字段索引,一个采用升序模式,另一个采用降序模式。

  • Cloud Firestore 会为每个映射字段创建以下索引:

    • 每个非数组、非映射子字段都有一个集合范围的升序索引。
    • 每个非数组、非映射子字段都有一个集合范围的降序索引。
    • 每个数组子字段的一个集合范围的 array-contains 索引。
    • Cloud Firestore 以递归方式为每个映射子字段编制索引。
  • 对于文档中的每个数组字段,Cloud Firestore 会创建并维护一个集合范围的 array-contains 索引。

  • 默认情况下,系统不维护集合组范围的单字段索引。

单字段索引例外项

您可以通过创建单字段索引例外项来从自动索引设置中排除字段。 索引例外项会覆盖适用于整个数据库的自动索引设置。例外项可让您启用自动索引设置停用的单字段索引,或停用自动索引启用的单字段索引。如需了解例外项的适用场景,请参阅索引最佳实践

使用 * 字段路径值,为集合组中的所有字段添加集合级索引例外项。例如,对于集合组 comments,将字段路径设置为 *,使之匹配 comments 集合组中的所有字段,并禁止将该集合组下的所有字段编入索引。然后,可以添加例外项,以便仅将查询所需的字段编入索引。如果减少编入索引的字段的数量,则可以降低存储费用并提高写入性能。

如果为映射字段创建单字段索引例外项,映射的子字段会继承这些设置。不过,您也可以为特定子字段定义单字段索引例外项。如果删除子字段的例外项,子字段将继承其父级的例外项设置(如果有),如果没有父级例外项,则继承数据库范围的设置。

如需创建和管理单字段索引例外项,请参阅管理索引

复合索引

复合索引根据要建立索引的字段的有序列表为一个集合中的所有文档存储一个映射,并按顺序对其排序。

Cloud Firestore 使用复合索引来支持单字段索引不支持的查询。

Cloud Firestore 不会像自动创建单字段索引那样自动创建复合索引,因为可能的字段组合数太多。但是,Cloud Firestore 可以帮助您在构建应用时识别并创建必需的复合索引

每当您尝试运行没有索引支持的查询时,Cloud Firestore 都会返回一条错误消息,并提供一个链接,您可以点击该链接来创建缺少的索引。

您还可以使用控制台或 Firebase CLI 手动定义和管理复合索引。如需详细了解如何创建和管理复合索引,请参阅管理索引

索引模式和查询范围

虽然单字段索引和复合索引的配置方式不同,但都需要为其配置索引模式和查询范围。

索引模式

定义索引时,需要为每个编入索引的字段选择索引模式。每个字段的索引模式都支持针对该字段的特定查询子句。您可以选择以下某种索引模式:

索引模式 说明
升序 支持针对该字段的 <<===>=>!=innot-in 查询子句,并且支持根据此字段值按升序对结果进行排序。
降序 支持针对该字段的 <<===>=>!=innot-in 查询子句,并且支持根据此字段值按降序对结果进行排序。
Array‑contains 支持针对该字段的 array-containsarray-contains-any 查询子句。
矢量 支持在该字段上使用 FindNearest 查询子句。

查询范围

每个索引的范围都限定为一个集合或集合组。这称为索引的查询范围:

集合范围
Cloud Firestore 创建的索引默认具有集合范围。 这些索引支持从单个集合返回结果的查询。

集合组范围
集合组包括具有相同集合 ID 的所有集合。如需运行从集合组返回已过滤或已排序结果的集合组查询,必须创建具有集合组范围的相应索引。

默认排序方式和 __name__ 字段

除了按每个字段的指定索引模式(升序或降序)对文档进行排序之外,索引还会按每个文档的 __name__ 字段进行最终排序。__name__ 字段的值设置为完整的文档路径。这意味着结果集中具有相同字段值的文档将按文档路径排序。

默认情况下,__name__ 字段的排序方向与索引定义中最后排序的字段的方向相同。例如:

集合 编入索引的字段 查询范围
cities name, __name__ 集合
cities state, __name__ 集合
cities country, population, __name__ 集合

如需按非默认 __name__ 方向对结果排序,您需要创建该索引。

索引属性

可让查询以最高效方式执行的索引由以下属性定义:

  • 等式过滤条件中使用的字段
  • 排序顺序中使用的字段
  • 范围和不等式过滤条件中使用的字段(尚未包含在排序顺序中)
  • 聚合中使用的字段(尚未包含在排序顺序及范围和不等式过滤条件中)

Cloud Firestore 按如下方式计算查询结果:

  1. 找出与查询的集合、过滤条件属性、过滤条件运算符和排序顺序相对应的索引。
  2. 确定扫描开始的索引位置。起始位置以查询的等式过滤条件作为前缀,以第一个 orderBy 字段上的范围和不等式过滤条件结尾。
  3. 开始扫描索引,返回满足所有过滤条件的每个文档,直到扫描过程满足以下条件之一:
    • 发现不满足过滤条件的文档,并确认后续的所有文档都不能完全满足过滤条件。
    • 到达索引的末尾。
    • 收集查询所请求的最大结果数量。

索引示例

Cloud Firestore 会自动为您创建单字段索引,让您的应用可以快速执行最基本的数据库查询。您可以使用单字段索引执行基于字段值和比较运算符(<<===>=>in)的简单查询。对于数组字段,您可以使用单字段索引执行 array-containsarray-contains-any 查询。

为便于说明,请从索引创建的角度查看以下示例。以下代码段在 cities 集合中创建了一些 city 文档,并为每个文档设置了 namestatecountrycapitalpopulationtags 字段:

Web
var citiesRef = db.collection("cities");

citiesRef.doc("SF").set({
    name: "San Francisco", state: "CA", country: "USA",
    capital: false, population: 860000,
    regions: ["west_coast", "norcal"] });
citiesRef.doc("LA").set({
    name: "Los Angeles", state: "CA", country: "USA",
    capital: false, population: 3900000,
    regions: ["west_coast", "socal"] });
citiesRef.doc("DC").set({
    name: "Washington, D.C.", state: null, country: "USA",
    capital: true, population: 680000,
    regions: ["east_coast"] });
citiesRef.doc("TOK").set({
    name: "Tokyo", state: null, country: "Japan",
    capital: true, population: 9000000,
    regions: ["kanto", "honshu"] });
citiesRef.doc("BJ").set({
    name: "Beijing", state: null, country: "China",
    capital: true, population: 21500000,
    regions: ["jingjinji", "hebei"] });

假设使用默认的自动索引设置,Cloud Firestore 会为每个非数组字段更新一个升序单字段索引和一个降序单字段索引,并为数组字段更新一个 array-contains 单字段索引。下表中的每一行代表单字段索引中的一个条目:

集合 编入索引的字段 查询范围
cities name 集合
cities state 集合
cities country 集合
cities capital 集合
cities population 集合
cities name 集合
cities state 集合
cities country 集合
cities capital 集合
cities population 集合
cities array-contains regions 集合

单字段索引支持的查询

使用这些自动创建的单字段索引,您可以运行如下所示的简单查询:

Web
const stateQuery = citiesRef.where("state", "==", "CA");
const populationQuery = citiesRef.where("population", "<", 100000);
const nameQuery = citiesRef.where("name", ">=", "San Francisco");

您还可以创建 in 和复合等式 (==) 查询:

Web
citiesRef.where('country', 'in', ["USA", "Japan", "China"])

// Compound equality queries
citiesRef.where("state", "==", "CO").where("name", "==", "Denver")
citiesRef.where("country", "==", "USA")
         .where("capital", "==", false)
         .where("state", "==", "CA")
         .where("population", "==", 860000)

如果您需要运行使用了范围比较运算符(<<=>>=)的复合查询,或者您需要按照另一个字段进行排序,则必须为该查询创建复合索引

您可以使用 array-contains 索引查询 regions 数组字段:

Web
citiesRef.where("regions", "array-contains", "west_coast")
// array-contains-any and array-contains use the same indexes
citiesRef.where("regions", "array-contains-any", ["west_coast", "east_coast"])

复合索引支持的查询

Cloud Firestore 使用复合索引来支持单字段索引不支持的复合查询。例如,您需要使用复合索引来支持下列查询:

Web
citiesRef.where("country", "==", "USA").orderBy("population", "asc")
citiesRef.where("country", "==", "USA").where("population", "<", 3800000)
citiesRef.where("country", "==", "USA").where("population", ">", 690000)
// in and == clauses use the same index
citiesRef.where("country", "in", ["USA", "Japan", "China"])
         .where("population", ">", 690000)

这些查询需要使用下列复合索引。由于查询针对 country 字段使用等式(==in),因此您可以对此字段使用升序或降序索引模式。默认情况下,不等式子句会基于其中的字段使用升序排序。

集合 编入索引的字段 查询范围
cities (或 )country、 population 集合

如需以降序运行相同的查询,您需要针对 population 字段额外创建一个降序的复合索引:

Web
citiesRef.where("country", "==", "USA").orderBy("population", "desc")

citiesRef.where("country", "==", "USA")
         .where("population", "<", 3800000)
         .orderBy("population", "desc")

citiesRef.where("country", "==", "USA")
         .where("population", ">", 690000)
         .orderBy("population", "desc")

citiesRef.where("country", "in", ["USA", "Japan", "China"])
         .where("population", ">", 690000)
         .orderBy("population", "desc")
集合 编入索引的字段 查询范围
cities country、 population 集合
cities country population 集合

为避免因索引合并而导致性能下降,我们建议您创建复合索引,以将 array-containsarray-contains-any 查询与其他子句组合使用:

Web
citiesRef.where("regions", "array-contains", "east_coast")
         .where("capital", "==", true)

// array-contains-any and array-contains use the same index
citiesRef.where("regions", "array-contains-any", ["west_coast", "east_coast"])
         .where("capital", "==", true)
集合 编入索引的字段 查询范围
cities array-contains tags、(或 )capital 集合

集合组索引支持的查询

为了演示查询范围为集合组的索引,请将 landmarks 子集合添加到部分 city 文档:

Web
var citiesRef = db.collection("cities");

citiesRef.doc("SF").collection("landmarks").doc().set({
    name: "Golden Gate Bridge",
    category : "bridge" });
citiesRef.doc("SF").collection("landmarks").doc().set({
    name: "Golden Gate Park",
    category : "park" });

citiesRef.doc("DC").collection("landmarks").doc().set({
    name: "National Gallery of Art",
    category : "museum" });
citiesRef.doc("DC").collection("landmarks").doc().set({
    name: "National Mall",
    category : "park" });

使用查询范围为集合的如下单字段索引,您可以根据 category 字段查询单个城市的 landmarks 集合:

集合 编入索引的字段 查询范围
landmarks (或 )category 集合
Web
citiesRef.doc("SF").collection("landmarks").where("category", "==", "park")
citiesRef.doc("SF").collection("landmarks").where("category", "in", ["park", "museum"])

例如,如果您想要查询所有城市的地标,可以对包含所有 landmarks 集合的集合组运行此查询。您还必须启用具有集合组范围的 landmarks 单字段索引:

集合 编入索引的字段 查询范围
landmarks (或 )category 集合组

启用此索引后,您可以查询 landmarks 集合组:

Web
var landmarksGroupRef = db.collectionGroup("landmarks");

landmarksGroupRef.where("category", "==", "park")
landmarksGroupRef.where("category", "in", ["park", "museum"])

若要运行返回已过滤或已排序结果的集合组查询,必须启用范围为集合组的相应单字段索引或复合索引。但是,不过滤或不排序结果的集合组查询不需要任何其他索引定义。

例如,您可以在不启用其他索引的情况下运行以下集合组查询:

Web
db.collectionGroup("landmarks").get()

索引条目

项目的已配置索引和文档的结构决定了文档索引条目的数量。这些索引条目均会计入索引条目数限制

以下示例展示了文档的索引条目。

文档

/cities/SF

city_name : "San Francisco"
temperatures : {summer: 67, winter: 55}
neighborhoods : ["Mission", "Downtown", "Marina"]

单字段索引

  • city_name ASC
  • city_name DESC
  • temperatures.summer ASC
  • temperatures.summer DESC
  • temperatures.winter ASC
  • temperatures.winter DESC
  • neighborhoods Array Contains(ASC 及 DESC)

复合索引

  • city_name ASC, neighborhoods ARRAY
  • city_name DESC, neighborhoods ARRAY

索引条目

此索引配置会生成文档的以下索引条目:

索引 编入索引的数据
单字段索引条目
city_name ASC city_name: "San Francisco"
city_name DESC city_name: "San Francisco"
temperatures.summer ASC temperatures.summer: 67
temperatures.summer DESC temperatures.summer: 67
temperatures.winter ASC temperatures.winter: 55
temperatures.winter DESC temperatures.winter: 55
neighborhoods Array Contains ASC neighborhoods: "Mission"
neighborhoods Array Contains DESC neighborhoods: "Mission"
neighborhoods Array Contains ASC neighborhoods: "Downtown"
neighborhoods Array Contains DESC neighborhoods: "Downtown"
neighborhoods Array Contains ASC neighborhoods: "Marina"
neighborhoods Array Contains DESC neighborhoods: "Marina"
复合索引条目
city_name ASC, neighborhoods ARRAY city_name: "San Francisco", neighborhoods: "Mission"
city_name ASC, neighborhoods ARRAY city_name: "San Francisco", neighborhoods: "Downtown"
city_name ASC, neighborhoods ARRAY city_name: "San Francisco", neighborhoods: "Marina"
city_name DESC, neighborhoods ARRAY city_name: "San Francisco", neighborhoods: "Mission"
city_name DESC, neighborhoods ARRAY city_name: "San Francisco", neighborhoods: "Downtown"
city_name DESC, neighborhoods ARRAY city_name: "San Francisco", neighborhoods: "Marina"

索引和价格

使用索引时,您的应用会产生存储费用。 如需详细了解如何计算索引的存储空间大小,请参阅索引条目大小

使用索引合并

虽然 Cloud Firestore 会为每个查询使用索引,但实际上没有必要为每个查询都创建一个索引。如果查询使用多个等式 (==) 子句和可选的 orderBy 子句,Cloud Firestore 可以重复利用现有的索引。Cloud Firestore 可以将针对简单等式过滤条件创建的索引合并起来,构建运行更大的等式查询所需的复合索引。

通过找出可使用索引合并的情况,您可以降低索引产生的费用。例如,一个餐厅评分应用有一个 restaurants 集合:

  • restaurants

    • burgerthyme

      name : "Burger Thyme"
      category : "burgers"
      city : "San Francisco"
      editors_pick : true
      star_rating : 4

此应用使用如下所示的查询。此应用使用的是 categorycityeditors_pick 等式子句的组合,并始终按 star_rating 进行升序排序:

Web
db.collection("restaurants").where("category", "==", "burgers")
                            .orderBy("star_rating")

db.collection("restaurants").where("city", "==", "San Francisco")
                            .orderBy("star_rating")

db.collection("restaurants").where("category", "==", "burgers")
                            .where("city", "==", "San Francisco")
                            .orderBy("star_rating")

db.collection("restaurants").where("category", "==", "burgers")
                            .where("city", "==" "San Francisco")
                            .where("editors_pick", "==", true )
                            .orderBy("star_rating")

您可以为每个查询创建一个索引:

集合 编入索引的字段 查询范围
restaurants category、 star_rating 集合
restaurants city、 star_rating 集合
restaurants category、 city、 star_rating 集合
restaurants category、 city、 editors_pick、 star_rating 集合

但更好的方式是,充分利用 Cloud Firestore 合并等式子句索引的功能,来减少索引的数量:

集合 编入索引的字段 查询范围
restaurants category、 star_rating 集合
restaurants city、 star_rating 集合
restaurants editors_pick、 star_rating 集合

此索引集不仅更小,还可支持其他查询:

Web
db.collection("restaurants").where("editors_pick", "==", true)
                            .orderBy("star_rating")

索引限制

索引存在以下限制。如需详细了解配额和限制,请参阅配额和限制

限制 详情
一个数据库的复合索引数量上限
数据库单字段配置的数量上限
  • 200(如果尚未为 Google Cloud 项目启用结算功能)。

    如果您需要更多配额,则必须为 Google Cloud 项目启用结算功能

  • 500(如果您为 Google Cloud 项目启用结算功能)。

一个字段级配置可以包含同一字段的多个配置。例如,单字段索引例外项和针对同一字段的 TTL 政策将被视为一个字段配置计入限额。

每个文档的索引条目数量上限

40000

索引条目的数量是文档的以下各项数量的总和:

  • 单字段索引条目的数量
  • 复合索引条目的数量

如需了解 Cloud Firestore 如何将一个文档和一组索引转变为索引条目,请参阅此索引条目计数示例

复合索引中的字段数上限 100
索引条目的大小上限

7.5 KiB

如需了解 Cloud Firestore 如何计算索引条目大小,请参阅索引条目大小

一个文档的索引条目的大小总和上限

8 MiB

总大小是文档的以下各项的大小总和:

  • 文档的单字段索引条目的大小总和
  • 文档的复合索引条目的大小总和
  • 编入索引的字段值的大小上限

    1500 字节

    超出 1500 字节的字段值会被截断。包含被截断的字段值的查询可能会返回不一致的结果。

    索引最佳实践

    对于大多数应用,您可以依靠自动索引和错误消息链接来管理索引。但是,在以下情况下,您可能需要添加单字段例外项:

    场景 说明
    大型字符串字段

    如果您的字符串字段通常包含不用于查询的长字符串值,您可以选择不将该字段编入索引来降低存储费用。

    向所含文档具有依序值的集合进行高速率写入

    如果您将在某个集合中的各文档之间依序递增或递减的字段(如时间戳)编入索引,则向该集合写入数据的最大速率为每秒 500 次写入。如果您不根据具有序列值的字段进行查询,可以选择不将该字段编入索引来绕过此限制。

    例如,在具有高写入速率的 IoT 使用场景中,一个所含文档具有时间戳字段的集合可能会达到每秒 500 次的写入限制。

    TTL 字段

    请注意,如果您使用 TTL(存留时间)政策,则 TTL 字段必须是一个时间戳。默认情况下,系统会将 TTL 字段编入索引,这可能会在流量传输速率较高时影响性能。最佳做法是为 TTL 字段添加单字段例外项。

    大型数组或映射字段

    大型数组或映射字段可能会达到每个文档 40,000 个索引条目的限制。如果您的查询不是基于大型数组或映射字段,建议您不要将该数组或字段编入索引。

    如果您使用对多个字段使用范围和不等式运算符的查询,请参阅索引编制注意事项,以便优化 Cloud Firestore 查询的性能和费用

    如需详细了解如何解决索引编制问题(索引扇出、INVALID_ARGUMENT 错误),请参阅问题排查页面