[搜文档]HBase - 搜索结果

2.1.2　Apache Hadoop新版本的特性

45 2024-12-19 《Hadoop技术内幕：深入解析MapReduce架构设计与实现原理 (大数据技术丛书)》

2.1.2　Apache Hadoop新版本的特性 2.1.2　Apache Hadoop新版本的特性当前Apache Hadoop版本非常多，本小节将帮助读者梳理各个版本的特性以及它们之间的联系。在讲解Hadoop各版本之前，先要了解Apache软件发布方式。对于任何一个Apache开源项目，所有的基础特性均被添加到一个称为“trunk”的主代码...

第4章　Hadoop RPC框架解析

62 2024-12-19 《Hadoop技术内幕：深入解析MapReduce架构设计与实现原理 (大数据技术丛书)》

第4章　Hadoop RPC框架解析 4.1　Hadoop RPC框架概述第4章　Hadoop RPC框架解析网络通信模块是分布式系统中最底层的模块。它直接支撑了上层分布式环境下复杂的进程间通信（Inter-Process Communication, IPC）逻辑，是所有分布式系统的基础。远程过程调用（Remote Procedure Cal...

1.1.2　Hadoop的历史

39 2024-12-19 《Hadoop实战（第2版）》

1.1.2　Hadoop的历史 1.1.2　Hadoop的历史 Hadoop的源头是Apache Nutch，该项目始于2002年，是Apache Lucene的子项目之一。2004年，Google在“操作系统设计与实现”（Operating System Design and Implementation, OSDI）会议上公开发表了题为MapRe...

12.4.2　概念视图

25 2024-12-19 《Hadoop实战（第2版）》

12.4.2　概念视图 12.4.2　概念视图我们可以将一个表想象成一个大的映射关系，通过行键、行键+时间戳或行键+列（列族：列修饰符），就可以定位特定数据。HBase是稀疏存储数据的，因此某些列可以是空白的，表12-2是对应12.2节中创建的test表的数据概念视图。从上表中可以看出，test表有r1和r2两行数据，并且有c1和c2...

内容提要

54 2024-12-28 《七周七数据库》

内容提要内容提要如今，我们要面对和使用的数据正在变得越来越庞大和复杂。如果说数据是新的石油。那么数据库就是油田、炼油厂、钻井和油泵。作为一名现代的软件开发者，我们需要了解数据管理的新领域，既包括RDBMS，也包括NoSQL。本书遵循《七周七语言》的写作风格和体例，带领你学习和了解当令最热门的开源数据库。在简单的介绍之后，本书分章介绍了7种数据...

第19章　企业应用实例

33 2024-12-19 《Hadoop实战（第2版）》

第19章　企业应用实例第19章　企业应用实例本章内容 Hadoop在Yahoo！的应用 Hadoop在eBay的应用 Hadoop在百度的应用即刻搜索中的Hadoop Facebook中的Hadoop和HBase 本章小结本章参考资料当今世界，随着企业的数据量迅速增长，存储和处理大规模数据已成为人们的迫切需求。Hadoop作...

7.2.1　数据集

45 2024-12-25 《Spark大数据处理：技术、应用与性能优化》

7.2.1　数据集 7.2.1　数据集数据类型分为结构化数据、半结构化数据和非结构化数据。由于大数据环境下的数据类型复杂，负载多样，所以大数据Benchmark需要生成3种类型的数据和对应负载。 1）结构化数据：传统的关系数据模型、行数据，存储于数据库，可用二维表结构表示。典型场景为互联网电商交易数据、企业ERP系统、财务系统、医疗HIS数据...

19.5　Facebook中的Hadoop和HBase

37 2024-12-19 《Hadoop实战（第2版）》

19.5　Facebook中的Hadoop和HBase 19.5.1　Facebook中的任务特点 19.5　Facebook中的Hadoop和HBase 众所周知，Facebook是目前世界上最大的社交网站。从2004年创建之初的以服务学生为目的的局部交互网站发展到2009年世界范围内的综合社交网站，服务8亿多人群，而现在它已经剑指移动服务、搜索...

8.1.5　未来展望

39 2024-12-25 《Spark大数据处理：技术、应用与性能优化》

8.1.5　未来展望 8.1.5　未来展望 Spark SQL提供了对RDD的SQL支持，同时支持其他数据源，如Parquet文件和Hive表。统一这些强大的数据存储模型能够让用户更加方便地分析复杂的数据。统一的Spark数据平台能够让用户选择需要的工具去处理数据，而不需要再构建另一套系统。未来Databricks会继续在Spark SQL生成自定义...

2.3.3　键值模型

27 2024-12-25 《大规模分布式存储系统：原理解析与架构实战》

2.3.3　键值模型 2.3.3　键值模型大量的NoSQL系统采用了键值模型（也称为Key-Value模型），每行记录由主键和值两个部分组成，支持基于主键的如下操作： ●Put：保存一个Key-Value对。 ●Get：读取一个Key-Value对。 ●Delete：删除一个Key-Value对。 Key-Value模型过于简单，支持的应用...

2.1.2 Apache Hadoop新版本的特性

第4章 Hadoop RPC框架解析

1.1.2 Hadoop的历史

12.4.2 概念视图

内容提要

第19章 企业应用实例

7.2.1 数据集

19.5 Facebook中的Hadoop和HBase

8.1.5 未来展望

2.3.3 键值模型