搜书网
发现
标签
注册
登录
搜书网
发现
榜单
标签
搜索
注册
登录
搜索
搜书网
本次搜索耗时
0.008
秒,为您找到
77
个相关结果.
书籍
文章
文件
3.2.1 RDD简介
31
2024-12-25
《Spark大数据处理:技术、应用与性能优化》
3.2.1 RDD简介 3.2.1 RDD简介 在集群背后,有一个非常重要的分布式数据架构,即弹性分布式数据集(resilient distributed dataset,RDD),它是逻辑集中的实体,在集群中的多台机器上进行了数据分区。通过对多台机器上不同RDD分区的控制,就能够减少机器之间的数据重排(data shuffling)。Spark提供...
1.1 Spark是什么
54
2024-12-25
《Spark大数据处理:技术、应用与性能优化》
1.1 Spark是什么 1.1 Spark是什么 Spark是基于内存计算的大数据并行计算框架。Spark基于内存计算,提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性,允许用户将Spark部署在大量廉价硬件之上,形成集群。 Spark于2009年诞生于加州大学伯克利分校AMPLab。目前,已经成为Apache软件基金会旗下的...
如何阅读本书
26
2024-12-19
《Hadoop实战(第2版)》
如何阅读本书 如何阅读本书 从整体内容上讲,本书包括19章和4个附录。前10章、第18章、第19章和4个附录主要介绍了Hadoop背景知识、Hadoop集群安装和代码执行、MapReduce机制及编程知识、HDFS实现细节及管理知识、Hadoop应用。第11章至第17章结合最新版本详细介绍了与Hadoop相关的其他项目,分别为Hive、HBase、M...
8.4.3 可靠性与可用性
38
2024-12-25
《大规模分布式存储系统:原理解析与架构实战》
8.4.3 可靠性与可用性 8.4.3 可靠性与可用性 分布式系统需要处理各种故障,例如,软件故障、服务器故障、网络故障、数据中心故障、地震、火灾等。与其他分布式存储系统一样,OceanBase通过冗余的方式保障了高可靠性和高可用性。方法如下所示: ●OceanBase在ChunkServer中保存了基线数据的多个副本。单集群部署时一般会配置3个副...
1.6.3 Hive的数据管理
42
2024-12-19
《Hadoop实战(第2版)》
1.6.3 Hive的数据管理 1.6.3 Hive的数据管理 Hive是建立在Hadoop上的数据仓库基础构架。它提供了一系列的工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。Hive定义了简单的类SQL的查询语言,称为Hive QL,它允许熟悉SQL的用户用SQL语言查询数据。作为一个数据仓...
9.2 HDFS简介
23
2024-12-19
《Hadoop实战(第2版)》
9.2 HDFS简介 9.2 HDFS简介 HDFS是基于流数据模式访问和处理超大文件的需求而开发的,它可以运行于廉价的商用服务器上。总的来说,可以将HDFS的主要特点概括为以下几点。 (1)处理超大文件 这里的超大文件通常是指数百MB、甚至数百TB大小的文件。目前在实际应用中,HDFS已经能用来存储管理PB(PeteBytes)级的数据了。在雅...
4.1 系统参数的配置
28
2024-12-19
《Hadoop实战(第2版)》
4.1 系统参数的配置 4.1 系统参数的配置 1.通过API对相关组件的参数进行配置 Hadoop有很多自己的组件(例如Hbase和Chukwa等),每一种组件都可以实现不同的功能,并起着不同的作用,通过多种组件的配合使用,Hadoop就能够实现非常强大的功能。这些可以通过Hadoop的API对相关参数进行配置来实现。 先简单地介绍一下API[...
序
45
2024-12-28
《七周七数据库》
序 序 在科罗拉多州布雷肯里奇(Breckenridge)的滑雪季里,登上 Beaver 雪道运行超级缆车,一眼望去,滑雪道的斜坡被精心地修整过,而山上的植被和覆盖的雪层却依然如旧。我们在心里发问,新雪在哪里呢?没有新雪,滑雪的体验就不那么美妙了。 1994年,作为 IBM 在奥斯汀的数据库开发实验室工作的雇员,我的感觉非常类似。当时我刚在奥斯汀的...
8.2 设计思路
40
2024-12-25
《大规模分布式存储系统:原理解析与架构实战》
8.2 设计思路 8.2 设计思路 OceanBase的目标是支持数百TB的数据量以及数十万TPS、数百万QPS的访问量,无论是数据量还是访问量,即使采用非常昂贵的小型机甚至是大型机,单台关系数据库系统都无法承受。 一种常见的做法是根据业务特点对数据库进行水平拆分,通常的做法是根据某个业务字段(通常取用户编号,user_id)哈希后取模,根据取模的...
第9章 结束语
67
2024-12-28
《七周七数据库》
第9章 结束语 9.1 类型终极版 9.1.1 关系型 9.1.2 键-值存储库 9.1.3 列型 9.1.4 文档型 9.1.5 图 9.2 选择 9.3 我们将走向哪里 第9章 结束语 现在,我们已经介绍完了7种数据库,祝贺大家! 我们希望你已经了解了这7种数据库。如果你在项目中使用某一种数据库,我们会很高兴。如果你决定使用多种...
1..
«
4
5
6
7
»
..8