搜书网 本次搜索耗时 0.009 秒,为您找到 61 个相关结果.
  • 16.6 本章小结

    16.6 本章小结 16.6 本章小结 本章内容主要包括:16.1节首先将说明如何声明Avro模式,以及如何对数据进行序列化;然后介绍对象容器文件的具体格式和RPC中Avro的使用方法,包括协议的声明、协议传输的格式等;最后介绍如何解析获取的数据,重点说明如何处理写入模式和读取模式的不同。16.2节介绍了在C和C++中如何使用Avro,主要叙述函数的...
  • 本章参考资料

    本章参考资料 本章参考资料 如果想要了解Hadoop在Yahoo!应用的更多细节和进展,请关注Yahoo!Hadoop团队的博客(developer.yahoo.com/blogs/hadoop)。 Hadoop在eBay的应用内容是根据eBay研究人员的技术博客[2]整理而成的,其中参考了eBay分析平台开发部Anil Madan介绍的...
  • 1.5.2 Spark在Yahoo!的应用

    1.5.2 Spark在Yahoo!的应用 1.5.2 Spark在Yahoo!的应用 在Spark技术的研究与应用方面,Yahoo!始终处于领先地位,它将Spark应用于公司的各种产品之中。移动App、网站、广告服务、图片服务等服务的后端实时处理框架均采用了Spark+Shark的架构。 在2013年,Yahoo!拥有72656600个页面,有上...
  • 3.1 Spark程序模型

    3.1 Spark程序模型 3.1 Spark程序模型 下面通过一个经典的示例程序来初步了解Spark的计算模型,过程如下。 1)SparkContext中的textFile函数从HDFS[1] 读取日志文件,输出变量file[2] 。 val file = sc . textFile ( "hdfs://xxx" ) 2)RDD中的...
  • 如何阅读本书

    如何阅读本书 如何阅读本书 从整体内容上讲,本书包括19章和4个附录。前10章、第18章、第19章和4个附录主要介绍了Hadoop背景知识、Hadoop集群安装和代码执行、MapReduce机制及编程知识、HDFS实现细节及管理知识、Hadoop应用。第11章至第17章结合最新版本详细介绍了与Hadoop相关的其他项目,分别为Hive、HBase、M...
  • buzz

    buzz 很高兴你向我询问有关 "buzz" 这个英文单词的相关信息。下面,我将为你详细解答。 分析词义 "Buzz" 在英语中是一个多义词,它既可以作为名词(noun),也可以作为动词(verb)。作为名词时,它表示忙碌、繁忙的活动,或者热烈的谈话或讨论。可以用来描述人们对某个话题的热切讨论或者对某个事件的关注程度。另一种用法可以表示嗡嗡声,尤其表...
  • 7.3.2 使用TPC-DS

    7.3.2 使用TPC-DS 7.3.2 使用TPC-DS 下面介绍TPC-DS(注:参见:http://www.tpc.org/tpcds/,TPC BenchmarkTMDS (TPC-DS):The New Decision Support Benchmark Standard。)的使用方式。 (1)下载最新的包 用户可以到TPC主页进行...
  • 11.3.4 上层服务

    11.3.4 上层服务 11.3.4 上层服务 在Hadoop中,很多上层服务充当Hadoop服务的请求代理,比如Oozie、Hive等。前面提到,Hadoop添加安全认证机制后,所有访问Hadoop的代理服务均需要拥有服务凭证。为此,Hadoop引入了“超级用户”的概念,这些用户可以以其他人的身份访问Hadoop的各个服务(类似于Linux中的su...
  • 第10章 Hadoop多用户作业调度器

    第10章 Hadoop多用户作业调度器 10.1 多用户调度器产生背景 第10章 Hadoop多用户作业调度器 Hadoop最初是为批处理作业而设计的,当时仅采用了一个简单的FIFO调度机制分配任务。但随着Hadoop的普及,单个Hadoop集群中的用户量和应用程序种类不断增加,适用于批处理场景的FIFO调度机制不能很好地利用集群资源,也不能够满足...
  • 1.6 Hadoop数据管理

    1.6 Hadoop数据管理 1.6.1 HDFS的数据管理 1.6 Hadoop数据管理 前面重点介绍了Hadoop及其体系结构与计算模型MapReduce,现在开始介绍Hadoop的数据管理,主要包括Hadoop的分布式文件系统HDFS、分布式数据库HBase和数据仓库工具Hive。 1.6.1 HDFS的数据管理 HDFS是分布式计算的...