6.1 LIKE操作符

前面介绍的所有操作符都是针对已知值进行过滤的。不管是匹配一个值还是多个值,检验大于还是小于已知值,或者检查某个范围的值,其共同点是过滤中使用的值都是已知的。

但是,这种过滤方法并不是任何时候都好用。例如,怎样搜索产品名中包含文本bean bag的所有产品?用简单的比较操作符肯定不行,必须使用通配符。利用通配符,可以创建比较特定数据的搜索模式。在这个例子中,如果你想找出名称包含bean bag的所有产品,可以构造一个通配符搜索模式,找出在产品名的任何位置出现bean bag的产品。

通配符(wildcard)
用来匹配值的一部分的特殊字符。

搜索模式(search pattern)
由字面值、通配符或两者组合构成的搜索条件。

通配符本身实际上是SQL的WHERE子句中有特殊含义的字符,SQL支持几种通配符。为在搜索子句中使用通配符,必须使用LIKE操作符。LIKE指示DBMS,后跟的搜索模式利用通配符匹配而不是简单的相等匹配进行比较。

谓词(predicate)
操作符何时不是操作符?答案是,它作为谓词时。从技术上说,LIKE是谓词而不是操作符。虽然最终的结果是相同的,但应该对此术语有所了解,以免在SQL文献或手册中遇到此术语时不知所云。

通配符搜索只能用于文本字段(串),非文本数据类型字段不能使用通配符搜索。

6.1.1 百分号(%)通配符

最常使用的通配符是百分号(%)。在搜索串中,%表示任何字符出现任意次数。例如,为了找出所有以词Fish起头的产品,可发布以下SELECT语句:

输入▼

  1. SELECT prod_id, prod_name
  2. FROM Products
  3. WHERE prod_name LIKE 'Fish%';

输出▼

  1. prod_id prod_name
  2. ------- ------------------
  3. BNBG01 Fish bean bag toy

分析▼

此例子使用了搜索模式'Fish%'。在执行这条子句时,将检索任意以Fish起头的词。%告诉DBMS接受Fish之后的任意字符,不管它有多少字符。

说明:Access通配符
如果使用的是Microsoft Access,需要使用*而不是%

说明:区分大小写
根据DBMS的不同及其配置,搜索可以是区分大小写的。如果区分大小写,则'fish%'Fish bean bag toy就不匹配。

通配符可在搜索模式中的任意位置使用,并且可以使用多个通配符。下面的例子使用两个通配符,它们位于模式的两端:

输入▼

  1. SELECT prod_id, prod_name
  2. FROM Products
  3. WHERE prod_name LIKE '%bean bag%';

输出▼

  1. prod_id prod_name
  2. -------- --------------------
  3. BNBG01 Fish bean bag toy
  4. BNBG02 Bird bean bag toy
  5. BNBG03 Rabbit bean bag toy

分析▼

搜索模式'%bean bag%'表示匹配任何位置上包含文本bean bag的值,不论它之前或之后出现什么字符。

通配符也可以出现在搜索模式的中间,虽然这样做不太有用。下面的例子找出以F起头、以y结尾的所有产品:

输入▼

  1. SELECT prod_name
  2. FROM Products
  3. WHERE prod_name LIKE 'F%y';

提示:根据部分信息搜索电子邮件地址
有一种情况下把通配符放在搜索模式中间是很有用的,就是根据邮件地址的一部分来查找电子邮件,例如WHERE email LIKE b%@forta.com

需要特别注意,除了能匹配一个或多个字符外,%还能匹配0个字符。%代表搜索模式中给定位置的0个、1个或多个字符。

说明:请注意后面所跟的空格
包括Access在内的许多DBMS都用空格来填补字段的内容。例如,如果某列有50个字符,而存储的文本为Fish bean bag toy(17个字符),则为填满该列需要在文本后附加33个空格。这样做一般对数据及其使用没有影响,但是可能对上述SQL语句有负面影响。子句WHERE prod_name LIKE 'F%y'只匹配以F开头、以y结尾的prod_name。如果值后面跟空格,则不是以y结尾,所以Fish bean bag toy就不会检索出来。简单的解决办法是给搜索模式再增加一个%号:'F%y%'还匹配y之后的字符(或空格)。更好的解决办法是用函数去掉空格。请参阅第8课。

 

警告:请注意NULL
通配符%看起来像是可以匹配任何东西,但有个例外,这就是NULL。子句WHERE prod_name LIKE '%'不会匹配产品名称为NULL的行。

6.1.2 下划线(_)通配符

另一个有用的通配符是下划线(_)。下划线的用途与%一样,但它只匹配单个字符,而不是多个字符。

说明:DB2通配符
DB2不支持通配符_

说明:Access通配符
如果使用的是Microsoft Access,需要使用?而不是_

举一个例子:

输入▼

  1. SELECT prod_id, prod_name
  2. FROM Products
  3. WHERE prod_name LIKE '__ inch teddy bear';

说明:请注意后面所跟的空格
与上例一样,可能需要给这个模式添加一个通配符。

输出▼

  1. prod_id prod_name
  2. -------- --------------------
  3. BR02 12 inch teddy bear
  4. BR03 18 inch teddy bear

分析▼

这个WHERE子句中的搜索模式给出了后面跟有文本的两个通配符。结果只显示匹配搜索模式的行:第一行中下划线匹配12,第二行中匹配188 inch teddy bear产品没有匹配,因为搜索模式要求匹配两个通配符而不是一个。对照一下,下面的SELECT语句使用%通配符,返回三行产品:

输入▼

  1. SELECT prod_id, prod_name
  2. FROM Products
  3. WHERE prod_name LIKE '% inch teddy bear';

输出▼

  1. prod_id prod_name
  2. -------- --------------------
  3. BR01 8 inch teddy bear
  4. BR02 12 inch teddy bear
  5. BNR3 18 inch teddy bear

%能匹配0个字符不同,_总是刚好匹配一个字符,不能多也不能少。

6.1.3 方括号([ ])通配符

方括号([])通配符用来指定一个字符集,它必须匹配指定位置(通配符的位置)的一个字符。

说明:并不总是支持集合
与前面描述的通配符不一样,并不是所有DBMS都支持用来创建集合的[]。只有微软的Access和SQL Server支持集合。为确定你使用的DBMS是否支持集合,请参阅相应的文档。

例如,找出所有名字以JM起头的联系人,可进行如下查询:

输入▼

  1. SELECT cust_contact
  2. FROM Customers
  3. WHERE cust_contact LIKE '[JM]%'
  4. ORDER BY cust_contact;

输出▼

  1. cust_contact

Jim Jones John Smith Michelle Green

分析▼

此语句的WHERE子句中的模式为'[JM]%'。这一搜索模式使用了两个不同的通配符。[JM]匹配任何以方括号中字母开头的联系人名,它也只能匹配单个字符。因此,任何多于一个字符的名字都不匹配。[JM]之后的%通配符匹配第一个字符之后的任意数目的字符,返回所需结果。

此通配符可以用前缀字符^(脱字号)来否定。例如,下面的查询匹配不以JM起头的任意联系人名(与前一个例子相反):

输入▼

  1. SELECT cust_contact
  2. FROM Customers
  3. WHERE cust_contact LIKE '[^JM]%'
  4. ORDER BY cust_contact;

说明:Access中的否定集合
如果使用的是Microsoft Access,需要用!而不是^来否定一个集合,因此,使用的是[!JM]而不是[^JM]

当然,也可以使用NOT操作符得出相同的结果。^的唯一优点是在使用多个WHERE子句时可以简化语法:

输入▼

  1. SELECT cust_contact
  2. FROM Customers
  3. WHERE NOT cust_contact LIKE '[JM]%'
  4. ORDER BY cust_contact;