14.2 Pig的安装和配置

14.2.1 Pig的安装条件

1.Hadoop 1.0.1

Pig有两种运行模式:Local模式和MapReduce模式。如果需要让作业在分布式环境下运行,则需要安装Hadoop,否则用户可以选择不安装。另外,当前Hadoop最新的版本为1.0.1,当然用户也可以选择安装其他版本,不过这里建议安装最新的Hadoop版本。因为新的版本修正了以前版本中的一些错误,并且添加了新的特性[1]

2.Java 1.6

建议安装Java 1.6以上的版本。Java环境对于Pig来说是必需的(推荐从SUN官方网站下载)。

当下载安装完毕Java后,我们还需要对Java环境变量进行设置,将JAVA_HOME指向Java的安装位置。

如果用户使用的是Linux操作系统,那么以上条件就足够了。如果用户使用的是Windows操作系统,那么除此之外,用户还需要安装Cygwin和Perl包。本章后面的案例将以Linux操作系统为例进行讲解。

[1]关于Hadoop的具体信息见相关章节。