1.3 搭建Hadoop源代码阅读环境
1.3.1 创建Hadoop工程
本小节介绍如何创建一个Hadoop源代码工程,以方便阅读源代码。创建一个Hadoop工程,可分两个步骤完成:
步骤1 解压缩Hadoop源代码。将下载到的Hadoop源代码压缩包hadoop-1.0.0.tar.gz解压到工作目录下(对于Windows系统而言,为了操作方便,解压到Cygwin安装目录的home/${USER}文件夹下)。
步骤2 新建Java工程。打开Eclipse,进入Eclipse可视化界面后,如图1-5所示,依次单击“File”→“New”→“Java Project”,并在弹出的对话框中取消选中“Use default location”前的勾号,然后选择Hadoop安装目录的位置。默认情况下,工程名称与Hadoop安装目录名称相同,用户可自行修改。单击完成按钮,Hadoop源代码工程创建完毕。
图 1-5 新建Hadoop工程
回到Eclipse主界面后,打开新建的Hadoop工程,可看到整个工程的组织代码,如图1-6所示,源代码按目录组织,且每个目录下以jar包为单位显示各个Java文件。
图 1-6 Hadoop工程展示(部分)源代码方式
除了使用源代码压缩包导入Eclipse工程的方法外,读者可以尝试直接从Hadoop SVN上导入Hadoop源代码。这些源代码本身已经是从Eclipse工程导出的,Hadoop SVN地址为:http://svn.apache.org/repos/asf/hadoop/common/branches/。