8.2 使用函数

大多数SQL实现支持以下类型的函数。

  • 用于处理文本字符串(如删除或填充值,转换值为大写或小写)的文本函数。
  • 用于在数值数据上进行算术操作(如返回绝对值,进行代数运算)的数值函数。
  • 用于处理日期和时间值并从这些值中提取特定成分(如返回两个日期之差,检查日期有效性)的日期和时间函数。
  • 返回DBMS正使用的特殊信息(如返回用户登录信息)的系统函数。

我们在上一课看到函数用作SELECT语句的列表成分,但函数的作用不仅于此。它还可以作为SELECT语句的其他成分,如在WHERE子句中使用,在其他SQL语句中使用等,后面会做更多的介绍。

8.2.1 文本处理函数

在上一课,我们已经看过一个文本处理函数的例子,其中使用RTRIM()函数来去除列值右边的空格。下面是另一个例子,这次使用的是UPPER()函数:

输入▼

  1. SELECT vend_name, UPPER(vend_name) AS vend_name_upcase
  2. FROM Vendors
  3. ORDER BY vend_name;

输出▼

  1. vend_name vend_name_upcase
  2. --------------------------- ----------------------------
  3. Bear Emporium BEAR EMPORIUM
  4. Bears R Us BEARS R US
  5. Doll House Inc. DOLL HOUSE INC.
  6. Fun and Games FUN AND GAMES
  7. Furball Inc. FURBALL INC.
  8. Jouets et ours JOUETS ET OURS

分析▼

可以看到,UPPER()将文本转换为大写,因此本例子中每个供应商都列出两次,第一次为Vendors表中存储的值,第二次作为列vend_name_upcase转换为大写。

表8-2列出了一些常用的文本处理函数。

表8-2 常用的文本处理函数

函  数 说  明
LEFT()(或使用子字符串函数) 返回字符串左边的字符
LENGTH()(也使用DATALENGTH()或LEN()) 返回字符串的长度
LOWER()(Access使用LCASE()) 将字符串转换为小写
LTRIM() 去掉字符串左边的空格
RIGHT()(或使用子字符串函数) 返回字符串右边的字符
RTRIM() 去掉字符串右边的空格
SOUNDEX() 返回字符串的SOUNDEX值
UPPER()(Access使用UCASE()) 将字符串转换为大写

表8-2中的SOUNDEX需要做进一步的解释。SOUNDEX是一个将任何文本串转换为描述其语音表示的字母数字模式的算法。SOUNDEX考虑了类似的发音字符和音节,使得能对字符串进行发音比较而不是字母比较。虽然SOUNDEX不是SQL概念,但多数DBMS都提供对SOUNDEX的支持。

说明:SOUNDEX支持
Microsoft Access和PostgreSQL不支持SOUNDEX(),因此以下的例子不适用于这些DBMS。

另外,如果在创建SQLite时使用了SQLITE_SOUNDEX编译时选项,那么SOUNDEX()在SQLite中就可用。因为SQLITE_SOUNDEX不是默认的编译时选项,所以多数SQLite实现不支持SOUNDEX()

下面给出一个使用SOUNDEX()函数的例子。Customers表中有一个顾客Kids Place,其联系名为Michelle Green。但如果这是错误的输入,此联系名实际上应该是Michael Green,该怎么办呢?显然,按正确的联系名搜索不会返回数据,如下所示:

输入▼

  1. SELECT cust_name, cust_contact
  2. FROM Customers
  3. WHERE cust_contact = 'Michael Green';

输出▼

  1. cust_name cust_contact
  2. -------------------------- ----------------------------

现在试一下使用SOUNDEX()函数进行搜索,它匹配所有发音类似于Michael Green的联系名:

输入▼

  1. SELECT cust_name, cust_contact
  2. FROM Customers
  3. WHERE SOUNDEX(cust_contact) = SOUNDEX('Michael Green');

输出▼

  1. cust_name cust_contact
  2. -------------------------- ----------------------------
  3. Kids Place Michelle Green

分析▼

在这个例子中,WHERE子句使用SOUNDEX()函数把cust_contact列值和搜索字符串转换为它们的SOUNDEX值。因为Michael GreenMichelle Green发音相似,所以它们的SOUNDEX值匹配,因此WHERE子句正确地过滤出了所需的数据。

8.2.2 日期和时间处理函数

日期和时间采用相应的数据类型存储在表中,每种DBMS都有自己的特殊形式。日期和时间值以特殊的格式存储,以便能快速和有效地排序或过滤,并且节省物理存储空间。

应用程序一般不使用日期和时间的存储格式,因此日期和时间函数总是用来读取、统计和处理这些值。由于这个原因,日期和时间函数在SQL中具有重要的作用。遗憾的是,它们很不一致,可移植性最差。

我们举个简单的例子,来说明日期处理函数的用法。Orders表中包含的订单都带有订单日期。为在SQL Server中检索2012年的所有订单,可如下进行:

输入▼

  1. SELECT order_num
  2. FROM Orders
  3. WHERE DATEPART(yy, order_date) = 2012;

输出▼

  1. order_num

20005 20006 20007 20008 20009

在Access中使用如下版本:

输入▼

  1. SELECT order_num
  2. FROM Orders
  3. WHERE DATEPART('yyyy', order_date) = 2012;

分析▼

这个例子(SQL Server和Sybase版本以及Access版本)使用了DATEPART()函数,顾名思义,此函数返回日期的某一部分。DATEPART()函数有两个参数,它们分别是返回的成分和从中返回成分的日期。在此例子中,DATEPART()只从order_date列中返回年份。通过与2012比较,WHERE子句只过滤出此年份的订单。

下面是使用名为DATE_PART()的类似函数的PostgreSQL版本:

输入▼

  1. SELECT order_num
  2. FROM Orders
  3. WHERE DATE_PART('year', order_date) = 2012;

Oracle没有DATEPART()函数,不过有几个可用来完成相同检索的日期处理函数。例如:

输入▼

  1. SELECT order_num
  2. FROM Orders
  3. WHERE to_number(to_char(order_date, 'YYYY')) = 2012;

分析▼

在这个例子中,to_char()函数用来提取日期的成分,to_number()用来将提取出的成分转换为数值,以便能与2012进行比较。

完成相同工作的另一方法是使用BETWEEN操作符:

输入▼

  1. SELECT order_num
  2. FROM Orders
  3. WHERE order_date BETWEEN to_date('01-01-2012')
  4. AND to_date('12-31-2012');

分析▼

在此例子中,Oracle的to_date()函数用来将两个字符串转换为日期。一个包含2012年1月1日,另一个包含2012年12月31日。BETWEEN操作符用来找出两个日期之间的所有订单。值得注意的是,相同的代码在SQL Server中不起作用,因为它不支持to_date()函数。但是,如果用DATEPART()替换to_date(),当然可以使用这种类型的语句。

MySQL和MariaDB具有各种日期处理函数,但没有DATEPART()。MySQL和MariaDB用户可使用名为YEAR()的函数从日期中提取年份:

输入▼

  1. SELECT order_num
  2. FROM Orders
  3. WHERE YEAR(order_date) = 2012;

在SQLite中有个小技巧:

输入▼

  1. SELECT order_num
  2. FROM Orders
  3. WHERE strftime('%Y', order_date) = 2012;

这里给出的例子提取和使用日期的成分(年)。按月份过滤,可以进行相同的处理,指定AND操作符以及年和月份的比较。

DBMS提供的功能远不止简单的日期成分提取。大多数DBMS具有比较日期、执行基于日期的运算、选择日期格式等的函数。但是,可以看到,不同DBMS的日期-时间处理函数可能不同。关于具体DBMS支持的日期-时间处理函数,请参阅相应的文档。

8.2.3 数值处理函数

数值处理函数仅处理数值数据。这些函数一般主要用于代数、三角或几何运算,因此不像字符串或日期-时间处理函数使用那么频繁。

具有讽刺意味的是,在主要DBMS的函数中,数值函数是最一致、最统一的函数。表8-3列出一些常用的数值处理函数。

表8-3 常用数值处理函数

函  数 说  明
ABS() 返回一个数的绝对值
COS() 返回一个角度的余弦
EXP() 返回一个数的指数值
PI() 返回圆周率
SIN() 返回一个角度的正弦
SQRT() 返回一个数的平方根
TAN() 返回一个角度的正切

关于具体DBMS所支持的算术处理函数,请参阅相应的文档。