14.3.3 Pig Latin的数据类型

1.数据模式

Pig Latin中数据的组织形式包括:关系(relation)、包(bag)、元组(tuple)和域(field)。

一个关系可以按如下方式定义:

一个关系就是一个包(更具体地说,是一个外部包);

包是元组的集合;

元组是域的有序集合;

域是一个数据块。

一个Pig关系是一个由元组组成的包,Pig中的关系和关系数据库中的表(table)很相似,包中的元组相当于表中的行。但是和关系表不同的是,Pig中不需要每一个元组包含相同数目或者相同位置的域(同列域),也不需要具有相同的数据类型。

另外,关系是无序的,这就意味着Pig不能保证元组按特定的顺序来执行。

2.数据类型

表14-1给出了一些简单数据类型的描述及示例。限于篇幅我们不再做更详细的介绍,具体内容大家可以在使用中慢慢体会。

14.3.3 Pig Latin的数据类型 - 图1

14.3.3 Pig Latin的数据类型 - 图2