22.1 约束

SQL已经改进过多个版本,成为非常完善和强大的语言。许多强有力的特性给用户提供了高级的数据处理技术,如约束。

关联表和引用完整性已经在前面讨论过几次。正如所述,关系数据库存储分解为多个表的数据,每个表存储相应的数据。利用键来建立从一个表到另一个表的引用(由此产生了术语引用完整性(referential integrity))。

正确地进行关系数据库设计,需要一种方法保证只在表中插入合法数据。例如,如果Orders表存储订单信息,OrderItems表存储订单详细内容,应该保证OrderItems中引用的任何订单ID都存在于Orders中。类似地,在Orders表中引用的任意顾客必须存在于Customers表中。

虽然可以在插入新行时进行检查(在另一个表上执行SELECT,以保证所有值合法并存在),但最好不要这样做,原因如下:

  • 如果在客户端层面上实施数据库完整性规则,则每个客户端都要被迫实施这些规则,一定会有一些客户端不实施这些规则。
  • 在执行UPDATEDELETE操作时,也必须实施这些规则。
  • 执行客户端检查是非常耗时的,而DBMS执行这些检查会相对高效。

约束(constraint)
管理如何插入或处理数据库数据的规则。

DBMS通过在数据库表上施加约束来实施引用完整性。大多数约束是在表定义中定义的,如第17课所述,用CREATE TABLEALTER TABLE语句。

注意:具体DBMS的约束
有几种不同类型的约束,每个DBMS都提供自己的支持。因此,这里给出的例子在不同的DBMS上可能有不同的反应。在进行试验之前,请参阅具体的DBMS文档。

22.1.1 主键

我们在第1课简单提过主键。主键是一种特殊的约束,用来保证一列(或一组列)中的值是唯一的,而且永不改动。换句话说,表中的一列(或多个列)的值唯一标识表中的每一行。这方便了直接或交互地处理表中的行。没有主键,要安全地UPDATEDELETE特定行而不影响其他行会非常困难。

表中任意列只要满足以下条件,都可以用于主键:

  • 任意两行的主键值都不相同。
  • 每行都具有一个主键值(即列中不允许NULL值)。
  • 包含主键值的列从不修改或更新。(大多数DBMS不允许这么做,但如果你使用的DBMS允许这样做,好吧,千万别!)
  • 主键值不能重用。如果从表中删除某一行,其主键值不分配给新行。

一种定义主键的方法是创建它,如下所示:

输入▼

  1. CREATE TABLE Vendors
  2. (
  3. vend_id CHAR(10) NOT NULL PRIMARY KEY,
  4. vend_name CHAR(50) NOT NULL,
  5. vend_address CHAR(50) NULL,
  6. vend_city CHAR(50) NULL,
  7. vend_state CHAR(5) NULL,
  8. vend_zip CHAR(10) NULL,
  9. vend_country CHAR(50) NULL
  10. );

分析▼

在此例子中,给表的vend_id列定义添加关键字PRIMARY KEY,使其成为主键。

输入▼

  1. ALTER TABLE Vendors
  2. ADD CONSTRAINT PRIMARY KEY (vend_id);

分析▼

这里定义相同的列为主键,但使用的是CONSTRAINT语法。此语法也可以用于CREATE TABLEALTER TABLE语句。

说明:SQLite中的键
SQLite不允许使用ALTER TABLE定义键,要求在初始的CREATE TABLE语句中定义它们。

22.1.2 外键

外键是表中的一列,其值必须列在另一表的主键中。外键是保证引用完整性的极其重要部分。我们举个例子来理解外键。

Orders表将录入到系统的每个订单作为一行包含其中。顾客信息存储在Customers表中。Orders表中的订单通过顾客ID与Customers表中的特定行相关联。顾客ID为Customers表的主键,每个顾客都有唯一的ID。订单号为Orders表的主键,每个订单都有唯一的订单号。

Orders表中顾客ID列的值不一定是唯一的。如果某个顾客有多个订单,则有多个行具有相同的顾客ID(虽然每个订单都有不同的订单号)。同时,Orders表中顾客ID列的合法值为Customers表中顾客的ID。

这就是外键的作用。在这个例子中,在Orders的顾客ID列上定义了一个外键,因此该列只能接受Customers表的主键值。

下面是定义这个外键的方法:

输入▼

  1. CREATE TABLE Orders
  2. (
  3. order_num INTEGER NOT NULL PRIMARY KEY,
  4. order_date DATETIME NOT NULL,
  5. cust_id CHAR(10) NOT NULL REFERENCES Customers(cust_id)
  6. );

分析▼

其中的表定义使用了REFERENCES关键字,它表示cust_id中的任何值都必须是Customers表的cust_id中的值。

相同的工作也可以在ALTER TABLE语句中用CONSTRAINT语法来完成:

输入▼

  1. ALTER TABLE Orders
  2. ADD CONSTRAINT
  3. FOREIGN KEY (cust_id) REFERENCES Customers (cust_id)

提示:外键有助防止意外删除
如第6课所述,除帮助保证引用完整性外,外键还有另一个重要作用。在定义外键后,DBMS不允许删除在另一个表中具有关联行的行。例如,不能删除关联订单的顾客。删除该顾客的唯一方法是首先删除相关的订单(这表示还要删除相关的订单项)。由于需要一系列的删除,因而利用外键可以防止意外删除数据。

有的DBMS支持称为级联删除(cascading delete)的特性。如果启用,该特性在从一个表中删除行时删除所有相关的数据。例如,如果启用级联删除并且从Customers表中删除某个顾客,则任何关联的订单行也会被自动删除。

22.1.3 唯一约束

唯一约束用来保证一列(或一组列)中的数据是唯一的。它们类似于主键,但存在以下重要区别。

  • 表可包含多个唯一约束,但每个表只允许一个主键。
  • 唯一约束列可包含NULL值。
  • 唯一约束列可修改或更新。
  • 唯一约束列的值可重复使用。
  • 与主键不一样,唯一约束不能用来定义外键。

employees表是一个使用约束的例子。每个雇员都有唯一的社会安全号,但我们并不想用它作主键,因为它太长(而且我们也不想使该信息容易利用)。因此,每个雇员除了其社会安全号外还有唯一的雇员ID(主键)。

雇员ID是主键,可以确定它是唯一的。你可能还想使DBMS保证每个社会安全号也是唯一的(保证输入错误不会导致使用他人号码)。可以通过在社会安全号列上定义UNIQUE约束做到。

唯一约束的语法类似于其他约束的语法。唯一约束既可以用UNIQUE关键字在表定义中定义,也可以用单独的CONSTRAINT定义。

22.1.4 检查约束

检查约束用来保证一列(或一组列)中的数据满足一组指定的条件。检查约束的常见用途有以下几点。

  • 检查最小或最大值。例如,防止0个物品的订单(即使0是合法的数)。
  • 指定范围。例如,保证发货日期大于等于今天的日期,但不超过今天起一年后的日期。
  • 只允许特定的值。例如,在性别字段中只允许MF

换句话说,第1课介绍的数据类型限制了列中可保存的数据的类型。检查约束在数据类型内又做了进一步的限制,这些限制极其重要,可以确保插入数据库的数据正是你想要的数据。不需要依赖于客户端应用程序或用户来保证正确获取它,DBMS本身将会拒绝任何无效的数据。

下面的例子对OrderItems表施加了检查约束,它保证所有物品的数量大于0:

输入▼

  1. CREATE TABLE OrderItems
  2. (
  3. order_num INTEGER NOT NULL,
  4. order_item INTEGER NOT NULL,
  5. prod_id CHAR(10) NOT NULL,
  6. quantity INTEGER NOT NULL CHECK (quantity > 0),
  7. item_price MONEY NOT NULL
  8. );

分析▼

利用这个约束,任何插入(或更新)的行都会被检查,保证quantity大于0。

检查名为gender的列只包含MF,可编写如下的ALTER TABLE语句:

输入▼

  1. ADD CONSTRAINT CHECK (gender LIKE '[MF]')

提示:用户定义数据类型
有的DBMS允许用户定义自己的数据类型。它们是定义检查约束(或其他约束)的基本简单数据类型。例如,你可以定义自己的名为gender的数据类型,它是单字符的文本数据类型,带限制其值为MF(对于未知值或许还允许NULL)的检查约束。然后,可以将此数据类型用于表的定义。定制数据类型的优点是只需施加约束一次(在数据类型定义中),而每当使用该数据类型时,都会自动应用这些约束。请查阅相应的DBMS文档,看它是否支持自定义数据类型。