22.1 约束
SQL已经改进过多个版本,成为非常完善和强大的语言。许多强有力的特性给用户提供了高级的数据处理技术,如约束。
关联表和引用完整性已经在前面讨论过几次。正如所述,关系数据库存储分解为多个表的数据,每个表存储相应的数据。利用键来建立从一个表到另一个表的引用(由此产生了术语引用完整性(referential integrity))。
正确地进行关系数据库设计,需要一种方法保证只在表中插入合法数据。例如,如果Orders
表存储订单信息,OrderItems
表存储订单详细内容,应该保证OrderItems
中引用的任何订单ID都存在于Orders
中。类似地,在Orders
表中引用的任意顾客必须存在于Customers
表中。
虽然可以在插入新行时进行检查(在另一个表上执行SELECT
,以保证所有值合法并存在),但最好不要这样做,原因如下:
- 如果在客户端层面上实施数据库完整性规则,则每个客户端都要被迫实施这些规则,一定会有一些客户端不实施这些规则。
- 在执行
UPDATE
和DELETE
操作时,也必须实施这些规则。 - 执行客户端检查是非常耗时的,而DBMS执行这些检查会相对高效。
约束(constraint)
管理如何插入或处理数据库数据的规则。
DBMS通过在数据库表上施加约束来实施引用完整性。大多数约束是在表定义中定义的,如第17课所述,用CREATE TABLE
或ALTER TABLE
语句。
注意:具体DBMS的约束
有几种不同类型的约束,每个DBMS都提供自己的支持。因此,这里给出的例子在不同的DBMS上可能有不同的反应。在进行试验之前,请参阅具体的DBMS文档。
22.1.1 主键
我们在第1课简单提过主键。主键是一种特殊的约束,用来保证一列(或一组列)中的值是唯一的,而且永不改动。换句话说,表中的一列(或多个列)的值唯一标识表中的每一行。这方便了直接或交互地处理表中的行。没有主键,要安全地UPDATE
或DELETE
特定行而不影响其他行会非常困难。
表中任意列只要满足以下条件,都可以用于主键:
- 任意两行的主键值都不相同。
- 每行都具有一个主键值(即列中不允许
NULL
值)。 - 包含主键值的列从不修改或更新。(大多数DBMS不允许这么做,但如果你使用的DBMS允许这样做,好吧,千万别!)
- 主键值不能重用。如果从表中删除某一行,其主键值不分配给新行。
一种定义主键的方法是创建它,如下所示:
输入▼
CREATE TABLE Vendors
(
vend_id CHAR(10) NOT NULL PRIMARY KEY,
vend_name CHAR(50) NOT NULL,
vend_address CHAR(50) NULL,
vend_city CHAR(50) NULL,
vend_state CHAR(5) NULL,
vend_zip CHAR(10) NULL,
vend_country CHAR(50) NULL
);
分析▼
在此例子中,给表的vend_id
列定义添加关键字PRIMARY KEY
,使其成为主键。
输入▼
ALTER TABLE Vendors
ADD CONSTRAINT PRIMARY KEY (vend_id);
分析▼
这里定义相同的列为主键,但使用的是CONSTRAINT
语法。此语法也可以用于CREATE TABLE
和ALTER TABLE
语句。
说明:SQLite中的键
SQLite不允许使用ALTER TABLE
定义键,要求在初始的CREATE TABLE
语句中定义它们。
22.1.2 外键
外键是表中的一列,其值必须列在另一表的主键中。外键是保证引用完整性的极其重要部分。我们举个例子来理解外键。
Orders
表将录入到系统的每个订单作为一行包含其中。顾客信息存储在Customers
表中。Orders
表中的订单通过顾客ID与Customers
表中的特定行相关联。顾客ID为Customers
表的主键,每个顾客都有唯一的ID。订单号为Orders
表的主键,每个订单都有唯一的订单号。
Orders
表中顾客ID列的值不一定是唯一的。如果某个顾客有多个订单,则有多个行具有相同的顾客ID(虽然每个订单都有不同的订单号)。同时,Orders
表中顾客ID列的合法值为Customers
表中顾客的ID。
这就是外键的作用。在这个例子中,在Orders
的顾客ID列上定义了一个外键,因此该列只能接受Customers
表的主键值。
下面是定义这个外键的方法:
输入▼
CREATE TABLE Orders
(
order_num INTEGER NOT NULL PRIMARY KEY,
order_date DATETIME NOT NULL,
cust_id CHAR(10) NOT NULL REFERENCES Customers(cust_id)
);
分析▼
其中的表定义使用了REFERENCES
关键字,它表示cust_id
中的任何值都必须是Customers
表的cust_id
中的值。
相同的工作也可以在ALTER TABLE
语句中用CONSTRAINT
语法来完成:
输入▼
ALTER TABLE Orders
ADD CONSTRAINT
FOREIGN KEY (cust_id) REFERENCES Customers (cust_id)
提示:外键有助防止意外删除
如第6课所述,除帮助保证引用完整性外,外键还有另一个重要作用。在定义外键后,DBMS不允许删除在另一个表中具有关联行的行。例如,不能删除关联订单的顾客。删除该顾客的唯一方法是首先删除相关的订单(这表示还要删除相关的订单项)。由于需要一系列的删除,因而利用外键可以防止意外删除数据。有的DBMS支持称为级联删除(cascading delete)的特性。如果启用,该特性在从一个表中删除行时删除所有相关的数据。例如,如果启用级联删除并且从
Customers
表中删除某个顾客,则任何关联的订单行也会被自动删除。
22.1.3 唯一约束
唯一约束用来保证一列(或一组列)中的数据是唯一的。它们类似于主键,但存在以下重要区别。
- 表可包含多个唯一约束,但每个表只允许一个主键。
- 唯一约束列可包含
NULL
值。 - 唯一约束列可修改或更新。
- 唯一约束列的值可重复使用。
- 与主键不一样,唯一约束不能用来定义外键。
employees
表是一个使用约束的例子。每个雇员都有唯一的社会安全号,但我们并不想用它作主键,因为它太长(而且我们也不想使该信息容易利用)。因此,每个雇员除了其社会安全号外还有唯一的雇员ID(主键)。
雇员ID是主键,可以确定它是唯一的。你可能还想使DBMS保证每个社会安全号也是唯一的(保证输入错误不会导致使用他人号码)。可以通过在社会安全号列上定义UNIQUE
约束做到。
唯一约束的语法类似于其他约束的语法。唯一约束既可以用UNIQUE
关键字在表定义中定义,也可以用单独的CONSTRAINT
定义。
22.1.4 检查约束
检查约束用来保证一列(或一组列)中的数据满足一组指定的条件。检查约束的常见用途有以下几点。
- 检查最小或最大值。例如,防止0个物品的订单(即使0是合法的数)。
- 指定范围。例如,保证发货日期大于等于今天的日期,但不超过今天起一年后的日期。
- 只允许特定的值。例如,在性别字段中只允许
M
或F
。
换句话说,第1课介绍的数据类型限制了列中可保存的数据的类型。检查约束在数据类型内又做了进一步的限制,这些限制极其重要,可以确保插入数据库的数据正是你想要的数据。不需要依赖于客户端应用程序或用户来保证正确获取它,DBMS本身将会拒绝任何无效的数据。
下面的例子对OrderItems
表施加了检查约束,它保证所有物品的数量大于0:
输入▼
CREATE TABLE OrderItems
(
order_num INTEGER NOT NULL,
order_item INTEGER NOT NULL,
prod_id CHAR(10) NOT NULL,
quantity INTEGER NOT NULL CHECK (quantity > 0),
item_price MONEY NOT NULL
);
分析▼
利用这个约束,任何插入(或更新)的行都会被检查,保证quantity
大于0。
检查名为gender
的列只包含M
或F
,可编写如下的ALTER TABLE
语句:
输入▼
ADD CONSTRAINT CHECK (gender LIKE '[MF]')
提示:用户定义数据类型
有的DBMS允许用户定义自己的数据类型。它们是定义检查约束(或其他约束)的基本简单数据类型。例如,你可以定义自己的名为gender
的数据类型,它是单字符的文本数据类型,带限制其值为M
或F
(对于未知值或许还允许NULL
)的检查约束。然后,可以将此数据类型用于表的定义。定制数据类型的优点是只需施加约束一次(在数据类型定义中),而每当使用该数据类型时,都会自动应用这些约束。请查阅相应的DBMS文档,看它是否支持自定义数据类型。