搜书网 本次搜索耗时 0.019 秒,为您找到 492 个相关结果.
  • 1.2 分布式产品Hadoop、ZooKeeper、HBase概述

    1.2 分布式产品Hadoop、ZooKeeper、HBase概述 1.Hadoop 2.ZooKeeper 3.HBase 1.2 分布式产品Hadoop、ZooKeeper、HBase概述 1.Hadoop 说到云计算技术和产品,不能不提到Google这家企业。曾经,微软是IT行业的象征,号称只招最聪明的人。十年后,微软逐渐疲软了下来,...
  • 第4章 HBase

    57 2024-12-28 《七周七数据库》
    第4章 HBase 4.1 介绍HBase 4.2 第1天:CRUD和表管理 4.2.1 配置HBase 4.2.2 HBase shell 4.2.3 创建表 4.2.4 插入、更新和读取数据 4.2.5 修改表 4.2.6 通过编程方式添加数据 4.2.7 第1天总结 4.3 第2天:处理大数据 4.3.1 导入数据,调用脚本 4.3...
  • 12.1 HBase简介

    12.1 HBase简介 12.1 HBase简介 HBase是Apache Hadoop的数据库,能够对大数据提供随机、实时的读写访问功能,具有开源、分布式、可扩展及面向列存储的特点。HBase是由Chang等人基于Google的Bigtable[1] 开发而成的。HBase的目标是存储并处理大型的数据,更具体来说是只需使用普通的硬件配置即可处理由...
  • 2.1.2 Apache Hadoop新版本的特性

    2.1.2 Apache Hadoop新版本的特性 2.1.2 Apache Hadoop新版本的特性 当前Apache Hadoop版本非常多,本小节将帮助读者梳理各个版本的特性以及它们之间的联系。在讲解Hadoop各版本之前,先要了解Apache软件发布方式。对于任何一个Apache开源项目,所有的基础特性均被添加到一个称为“trunk”的主代码...
  • 1.1.2 Hadoop的历史

    1.1.2 Hadoop的历史 1.1.2 Hadoop的历史 Hadoop的源头是Apache Nutch,该项目始于2002年,是Apache Lucene的子项目之一。2004年,Google在“操作系统设计与实现”(Operating System Design and Implementation, OSDI)会议上公开发表了题为MapRe...
  • 1.1 Spark是什么

    1.1 Spark是什么 1.1 Spark是什么 Spark是基于内存计算的大数据并行计算框架。Spark基于内存计算,提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性,允许用户将Spark部署在大量廉价硬件之上,形成集群。 Spark于2009年诞生于加州大学伯克利分校AMPLab。目前,已经成为Apache软件基金会旗下的...
  • 内容提要

    51 2024-12-28 《七周七数据库》
    内容提要 内容提要 如今,我们要面对和使用的数据正在变得越来越庞大和复杂。如果说数据是新的石油。那么数据库就是油田、炼油厂、钻井和油泵。作为一名现代的软件开发者,我们需要了解数据管理的新领域,既包括RDBMS,也包括NoSQL。 本书遵循《七周七语言》的写作风格和体例,带领你学习和了解当令最热门的开源数据库。在简单的介绍之后,本书分章介绍了7种数据...
  • 1.8 本章小结

    1.8 本章小结 1.8 本章小结 本章首先介绍了Hadoop分布式计算平台:它是由Apache软件基金会开发的一个开源分布式计算平台。以Hadoop分布式文件系统(HDFS)和MapReduce(Google MapReduce的开源实现)为核心的Hadoop为用户提供了系统底层细节透明的分布式基础架构。由于Hadoop拥有可计量、成本低、高效、可...
  • 第19章 企业应用实例

    第19章 企业应用实例 第19章 企业应用实例 本章内容 Hadoop在Yahoo!的应用 Hadoop在eBay的应用 Hadoop在百度的应用 即刻搜索中的Hadoop Facebook中的Hadoop和HBase 本章小结 本章参考资料 当今世界,随着企业的数据量迅速增长,存储和处理大规模数据已成为人们的迫切需求。Hadoop作...
  • 1.2 Hadoop项目及其结构

    1.2 Hadoop项目及其结构 1.2 Hadoop项目及其结构 现在Hadoop已经发展成为包含很多项目的集合。虽然其核心内容是MapReduce和Hadoop分布式文件系统,但与Hadoop相关的Common、Avro、Chukwa、Hive、HBase等项目也是不可或缺的。它们提供了互补性服务或在核心层上提供了更高层的服务。图1-1是Hado...