1.4 包
R提供了大量开箱即用的功能,但它最激动人心的一部分功能是通过可选模块的下载和安装来实现的。目前有2500多个1称为包(package)的用户贡献模块可从http://cran.r-project.org/web/packages下载。这些包提供了横跨各种领域、数量惊人的新功能,包括分析地理数据、处理蛋白质质谱,甚至是心理测验分析的功能。本书中多次使用了这些可选包。
1 截至本书中文版面世时,已超过4000个。——译者注
1.4.1 什么是包
包是R函数、数据、预编译代码以一种定义完善的格式组成的集合。计算机上存储包的目录称为库(library)。函数.libPaths()
能够显示库所在的位置, 函数library()
则可以显示库中有哪些包。
R自带了一系列默认包(包括base
、datasets
、utils
、grDevices
、graphics
、stats
以及methods
),它们提供了种类繁多的默认函数和数据集。其他包可通过下载来进行安装。安装好以后,它们必须被载入到会话中才能使用。命令search()
可以告诉你哪些包已加载并可使用。
1.4.2 包的安装
有许多R函数可以用来管理包。第一次安装一个包,使用命令install.packages()
即可。举例来说,不加参数执行install.packages()
将显示一个CRAN镜像站点的列表,选择其中一个镜像站点之后,将看到所有可用包的列表,选择其中的一个包即可进行下载和安装。如果知道自己想安装的包的名称,可以直接将包名作为参数提供给这个函数。例如,包gclus
中提供了创建增强型散点图的函数。可以使用命令install.packages("gclus")
来下载和安装它。
一个包仅需安装一次。但和其他软件类似,包经常被其作者更新。使用命令update.packages()
可以更新已经安装的包。要查看已安装包的描述,可以使用installed.packages()
命令,这将列出安装的包,以及它们的版本号、依赖关系等信息。
1.4.3 包的载入
包的安装是指从某个CRAN镜像站点下载它并将其放入库中的过程。要在R会话中使用它,还需要使用library()
命令载入这个包。例如,要使用gclus
包,执行命令library(gclus)
即可。当然,在载入一个包之前必须已经安装了这个包。在一个会话中,包只需载入一次。如果需要,你可以自定义启动环境以自动载入会频繁使用的那些包。启动环境的自定义在附录B中有详细描述。
1.4.4 包的使用方法
载入一个包之后,就可以使用一系列新的函数和数据集了。包中往往提供了演示性的小型数据集和示例代码,能够让我们尝试这些新功能。帮助系统包含了每个函数的一个描述(同时带有示例),每个数据集的信息也被包括其中。命令help(package="package_name")
可以输出某个包的简短描述以及包中的函数名称和数据集名称的列表。使用函数help()
可以查看其中任意函数或数据集的更多细节。这些信息也能以PDF帮助手册的形式从CRAN下载。
R语言编程中的常见错误
有一些错误是R的初学者和经验丰富的R程序员都可能常犯的。如果程序出错了,请检查以下几方面。
使用了错误的大小写。
help()
、Help()
和HELP()
是三个不同的函数(只有第一个是正确的)。忘记使用必要的引号。
install.packages("gclus")
能够正常执行,然而Install.packages(gclus)
将会报错。在函数调用时忘记使用括号。例如,要使用
help()
而非help
。即使函数无需参数,仍需加上()
。在Windows上,路径名中使用了\。R将反斜杠视为一个转义字符。
setwd("c:\mydata")
会报错。正确的写法是setwd("c:/mydata")
或setwd("c:\mydata")
。使用了一个尚未载入包中的函数。函数
order.clusters()
包含在包gclus
中。如果还没有载入这个包就使用它,将会报错。R的报错信息可能是含义模糊的,但如果谨慎遵守了以上要点,就应该可以避免许多错误。