10.2 创建分组
分组是使用SELECT
语句的GROUP BY
子句建立的。理解分组的最好办法是看一个例子:
输入▼
SELECT vend_id, COUNT(*) AS num_prods
FROM Products
GROUP BY vend_id;
输出▼
vend_id num_prods
------- ---------
BRS01 3
DLL01 4
FNG01 2
分析▼
上面的SELECT
语句指定了两个列:vend_id
包含产品供应商的ID,num_prods
为计算字段(用COUNT(*)
函数建立)。GROUP BY
子句指示DBMS按vend_id
排序并分组数据。这就会对每个vend_id
而不是整个表计算num_prods
一次。从输出中可以看到,供应商BRS01
有3
个产品,供应商DLL01
有4
个产品,而供应商FNG01
有2
个产品。
因为使用了GROUP BY
,就不必指定要计算和估值的每个组了。系统会自动完成。GROUP BY
子句指示DBMS分组数据,然后对每个组而不是整个结果集进行聚集。
在使用GROUP BY
子句前,需要知道一些重要的规定。
GROUP BY
子句可以包含任意数目的列,因而可以对分组进行嵌套,更细致地进行数据分组。- 如果在
GROUP BY
子句中嵌套了分组,数据将在最后指定的分组上进行汇总。换句话说,在建立分组时,指定的所有列都一起计算(所以不能从个别的列取回数据)。 GROUP BY
子句中列出的每一列都必须是检索列或有效的表达式(但不能是聚集函数)。如果在SELECT
中使用表达式,则必须在GROUP BY
子句中指定相同的表达式。不能使用别名。- 大多数SQL实现不允许
GROUP BY
列带有长度可变的数据类型(如文本或备注型字段)。 - 除聚集计算语句外,
SELECT
语句中的每一列都必须在GROUP BY
子句中给出。 - 如果分组列中包含具有
NULL
值的行,则NULL
将作为一个分组返回。如果列中有多行NULL
值,它们将分为一组。 GROUP BY
子句必须出现在WHERE
子句之后,ORDER BY
子句之前。
提示:
ALL
子句
Microsoft SQL Server等有些SQL实现在GROUP BY
中支持可选的ALL
子句。这个子句可用来返回所有分组,即使是没有匹配行的分组也返回(在此情况下,聚集将返回NULL
)。具体的DBMS是否支持ALL
,请参阅相应的文档。
警告:通过相对位置指定列
有的SQL实现允许根据SELECT
列表中的位置指定GROUP BY
的列。例如,GROUP BY 2, 1
可表示按选择的第二个列分组,然后再按第一个列分组。虽然这种速记语法很方便,但并非所有SQL实现都支持,并且使用它容易在编辑SQL语句时出错。