11.2 利用子查询进行过滤

本书所有课中使用的数据库表都是关系表(关于每个表及关系的描述,请参阅附录A)。订单存储在两个表中。每个订单包含订单编号、客户ID、订单日期,在Orders表中存储为一行。各订单的物品存储在相关的OrderItems表中。Orders表不存储顾客信息,只存储顾客ID。顾客的实际信息存储在Customers表中。

现在,假如需要列出订购物品RGAN01的所有顾客,应该怎样检索?下面列出具体的步骤。

  • 检索包含物品RGAN01的所有订单的编号。
  • 检索具有前一步骤列出的订单编号的所有顾客的ID。
  • 检索前一步骤返回的所有顾客ID的顾客信息。

上述每个步骤都可以单独作为一个查询来执行。可以把一条SELECT语句返回的结果用于另一条SELECT语句的WHERE子句。

也可以使用子查询来把3个查询组合成一条语句。

第一条SELECT语句的含义很明确,它对prod_idRGAN01的所有订单物品,检索其order_num列。输出列出了两个包含此物品的订单:

输入▼

  1. SELECT order_num
  2. FROM OrderItems
  3. WHERE prod_id = 'RGAN01';

输出▼

  1. order_num

20007 20008

现在,我们知道了哪个订单包含要检索的物品,下一步查询与订单2000720008相关的顾客ID。利用第5课介绍的IN子句,编写如下的SELECT语句:

输入▼

  1. SELECT cust_id
  2. FROM Orders
  3. WHERE order_num IN (20007,20008);

输出▼

  1. cust_id

1000000004 1000000005

现在,结合这两个查询,把第一个查询(返回订单号的那一个)变为子查询。请看下面的SELECT语句:

输入▼

  1. SELECT cust_id
  2. FROM Orders
  3. WHERE order_num IN (SELECT order_num
  4. FROM OrderItems
  5. WHERE prod_id = 'RGAN01');

输出▼

  1. cust_id

1000000004 1000000005

分析▼

SELECT语句中,子查询总是从内向外处理。在处理上面的SELECT语句时,DBMS实际上执行了两个操作。

首先,它执行下面的查询:

  1. SELECT order_num FROM orderitems WHERE prod_id='RGAN01'

此查询返回两个订单号:2000720008。然后,这两个值以IN操作符要求的逗号分隔的格式传递给外部查询的WHERE子句。外部查询变成:

  1. SELECT cust_id FROM orders WHERE order_num IN (20007,20008)

可以看到,输出是正确的,与前面硬编码WHERE子句所返回的值相同。

提示:格式化SQL
包含子查询的SELECT语句难以阅读和调试,它们在较为复杂时更是如此。如上所示,把子查询分解为多行并进行适当的缩进,能极大地简化子查询的使用。

顺便一提,这就是颜色编码起作用的地方,好的DBMS客户端正是出于这个原因使用了颜色代码SQL。

现在得到了订购物品RGAN01的所有顾客的ID。下一步是检索这些顾客ID的顾客信息。检索两列的SQL语句为:

输入▼

  1. SELECT cust_name, cust_contact
  2. FROM Customers
  3. WHERE cust_id IN ('1000000004','1000000005');

可以把其中的WHERE子句转换为子查询,而不是硬编码这些顾客ID:

输入▼

  1. SELECT cust_name, cust_contact
  2. FROM Customers
  3. WHERE cust_id IN (SELECT cust_id
  4. FROM Order
  5. WHERE order_num IN (SELECT order_num
  6. FROM OrderItems
  7. WHERE prod_id = 'RGAN01'));

输出▼

  1. cust_name cust_contact
  2. ----------------------------- --------------------
  3. Fun4All Denise L. Stephens
  4. The Toy Store Kim Howard

分析▼

为了执行上述SELECT语句,DBMS实际上必须执行三条SELECT语句。最里边的子查询返回订单号列表,此列表用于其外面的子查询的WHERE子句。外面的子查询返回顾客ID列表,此顾客ID列表用于最外层查询的WHERE子句。最外层查询返回所需的数据。

可见,在WHERE子句中使用子查询能够编写出功能很强且很灵活的SQL语句。对于能嵌套的子查询的数目没有限制,不过在实际使用时由于性能的限制,不能嵌套太多的子查询。

警告:只能是单列
作为子查询的SELECT语句只能查询单个列。企图检索多个列将返回错误。

警告:子查询和性能
这里给出的代码有效,并且获得了所需的结果。但是,使用子查询并不总是执行这类数据检索的最有效方法。更多的论述,请参阅第12课,其中将再次给出这个例子。