9.1 聚集函数
我们经常需要汇总数据而不用把它们实际检索出来,为此SQL提供了专门的函数。使用这些函数,SQL查询可用于检索数据,以便分析和报表生成。这种类型的检索例子有:
- 确定表中行数(或者满足某个条件或包含某个特定值的行数);
- 获得表中某些行的和;
- 找出表列(或所有行或某些特定的行)的最大值、最小值、平均值。
上述例子都需要汇总表中的数据,而不需要实际数据本身。因此,返回实际表数据纯属浪费时间和处理资源(更不用说带宽了)。再说一遍,我们实际想要的是汇总信息。
为方便这种类型的检索,SQL给出了5个聚集函数,见表9-1。这些函数能进行上述检索。与前一章介绍的数据处理函数不同,SQL的聚集函数在各种主要SQL实现中得到了相当一致的支持。
聚集函数(aggregate function) 对某些行运行的函数,计算并返回一个值。
表9-1 SQL聚集函数
函 数 | 说 明 |
---|---|
AVG() | 返回某列的平均值 |
COUNT() | 返回某列的行数 |
MAX() | 返回某列的最大值 |
MIN() | 返回某列的最小值 |
SUM() | 返回某列值之和 |
以下说明各函数的使用。
9.1.1 AVG()函数
AVG()
通过对表中行数计数并计算其列值之和,求得该列的平均值。AVG()
可用来返回所有列的平均值,也可以用来返回特定列或行的平均值。
下面的例子使用AVG()
返回Products
表中所有产品的平均价格:
输入▼
SELECT AVG(prod_price) AS avg_price
FROM Products;
输出▼
avg_price
avg_price
6.823333
分析▼
此SELECT
语句返回值avg_price
,它包含Products
表中所有产品的平均价格。如第7课所述,avg_price
是一个别名。
AVG()
也可以用来确定特定列或行的平均值。下面的例子返回特定供应商所提供产品的平均价格:
输入▼
SELECT AVG(prod_price) AS avg_price
FROM Products
WHERE vend_id = 'DLL01';
输出▼
avg_price
avg_price
3.8650
分析▼
这条SELECT
语句与前一条的不同之处在于,它包含了WHERE
子句。此WHERE
子句仅过滤出vend_id
为DLL01
的产品,因此avg_price
中返回的值只是该供应商产品的平均值。
警告:只用于单个列
AVG()只能用来确定特定数值列的平均值,而且列名必须作为函数参数给出。为了获得多个列的平均值,必须使用多个AVG()
函数。
说明:
NULL
值
AVG()
函数忽略列值为NULL
的行。
9.1.2 COUNT()函数
COUNT()
函数进行计数。可利用COUNT()
确定表中行的数目或符合特定条件的行的数目。
COUNT()
函数有两种使用方式:
- 使用
COUNT(*)
对表中行的数目进行计数,不管表列中包含的是空值(NULL
)还是非空值。 - 使用
COUNT(column)
对特定列中具有值的行进行计数,忽略NULL
值。
下面的例子返回Customers
表中顾客的总数:
输入▼
SELECT COUNT(*) AS num_cust
FROM Customers;
输出▼
num_cust
num_cust
5
分析▼
在此例子中,利用COUNT(*)
对所有行计数,不管行中各列有什么值。计数值在num_cust
中返回。
下面的例子只对具有电子邮件地址的客户计数:
输入▼
SELECT COUNT(cust_email) AS num_cust
FROM Customers;
输出▼
num_cust
num_cust
3
分析▼
这条SELECT
语句使用COUNT(cust_email)
对cust_email
列中有值的行进行计数。在此例子中,cust_email
的计数为3
(表示5个顾客中只有3个顾客有电子邮件地址)。
说明:
NULL
值
如果指定列名,则COUNT()
函数会忽略指定列的值为空的行,但如果COUNT()
函数中用的是星号(*
),则不忽略。
9.1.3 MAX()函数
MAX()
返回指定列中的最大值。MAX()
要求指定列名,如下所示:
输入▼
SELECT MAX(prod_price) AS max_price
FROM Products;
输出▼
max_price
max_price
11.9900
分析▼
这里,MAX()
返回Products
表中最贵物品的价格。
提示:对非数值数据使用
MAX()
虽然MAX()
一般用来找出最大的数值或日期值,但许多(并非所有)DBMS允许将它用来返回任意列中的最大值,包括返回文本列中的最大值。在用于文本数据时,MAX()
返回按该列排序后的最后一行。
说明:
NULL
值
MAX()
函数忽略列值为NULL
的行。
9.1.4 MIN()函数
MIN()
的功能正好与MAX()
功能相反,它返回指定列的最小值。与MAX()
一样,MIN()
要求指定列名,如下所示:
输入▼
SELECT MIN(prod_price) AS min_price
FROM Products;
输出▼
min_price
min_price
3.4900
分析▼
其中MIN()
返回Products
表中最便宜物品的价格。
提示:对非数值数据使用
MIN()
虽然MIN()
一般用来找出最小的数值或日期值,但许多(并非所有)DBMS允许将它用来返回任意列中的最小值,包括返回文本列中的最小值。在用于文本数据时,MIN()
返回该列排序后最前面的行。
说明:
NULL
值
MIN()
函数忽略列值为NULL
的行。
9.1.5 SUM()函数
SUM()
用来返回指定列值的和(总计)。下面举一个例子,OrderItems
包含订单中实际的物品,每个物品有相应的数量。可如下检索所订购物品的总数(所有quantity
值之和):
输入▼
SELECT SUM(quantity) AS items_ordered
FROM OrderItems
WHERE order_num = 20005;
输出▼
items_ordered
items_ordered
200
分析▼
函数SUM(quantity)
返回订单中所有物品数量之和,WHERE
子句保证只统计某个物品订单中的物品。
SUM()
也可以用来合计计算值。在下面的例子中,合计每项物品的item_price*quantity
,得出总的订单金额:
输入▼
SELECT SUM(item_price*quantity) AS total_price
FROM OrderItems
WHERE order_num = 20005;
输出▼
total_price
total_price
1648.0000
分析▼
函数SUM(item_price*quantity)
返回订单中所有物品价钱之和,WHERE
子句同样保证只统计某个物品订单中的物品。
提示:在多个列上进行计算
如本例所示,利用标准的算术操作符,所有聚集函数都可用来执行多个列上的计算。
说明:
NULL
值
SUM()
函数忽略列值为NULL
的行。