大规模分布式存储系统-原理解析与架构实战

节选

[

阿里巴巴高级技术专家(OceanBase核心开发人员)撰写,阳振坤、章文嵩、杨卫华、汪源、余锋(褚霸)、赖春波等来自阿里、新浪、网易和百度的资深技术专家联袂推荐。
系统讲解构建大规模存储系统的核心技术和原理,详细分析Google、Amazon、Microsoft和阿里巴巴的大规模分布式存储系统的原理。
实战性强,通过对阿里巴巴的分布式数据库OceanBase的实现细节进行深入分析,完整讲解了大规模分布式存储系统的架构方法与应用实践。

]

本书特色

[

   阿里巴巴高级技术专家(oceanbase核心开发人员)撰写,阳振坤、章文嵩、杨卫华、汪源、余锋(褚霸)、赖春波等来自阿里、新浪、网易和百度的资深技术专家联袂推荐。

  系统讲解构建大规模存储系统的核心技术和原理,详细分析google、amazon、microsoft和阿里巴巴的大规模分布式存储系统的原理。

  实战性强,通过对阿里巴巴的分布式数据库oceanbase的实现细节进行深入分析,完整讲解了大规模分布式存储系统的架构方法与应用实践。

]

内容简介

[

  本书是分布式系统领域的经典著作,由阿里巴巴高级技术专家“阿里日照”(oceanbase核心开发人员)撰写,阳振坤、章文嵩、杨卫华、汪源、余锋(褚霸)、赖春波等来自阿里、新浪、网易和百度的资深技术专家联袂推荐。理论方面,不仅讲解了大规模分布式存储系统的核心技术和基本原理,而且对谷歌、亚马逊、微软和阿里巴巴等国际型大互联网公司的大规模分布式存储系统进行了分析;实战方面,首先通过对阿里巴巴的分布式数据库oceanbase的实现细节的深入剖析完整地展示了大规模分布式存储系统的架构与设计过程,然后讲解了大规模分布式存储技术在云计算和大数据领域的实践与应用。

  本书内容分为四个部分:基础篇——分布式存储系统的基础知识,包含单机存储系统的知识,如数据模型、事务与并发控制、故障恢复、存储引擎、压缩/解压缩等;分布式系统的数据分布、复制、一致性、容错、可扩展性等。范型篇——介绍谷歌、亚马逊、微软、阿里巴巴等著名互联网公司的大规模分布式存储系统架构,涉及分布式文件系统、分布式键值系统、分布式表格系统以及分布式数据库技术等。实践篇——以阿里巴巴的分布式数据库oceanbase为例,详细介绍分布式数据库内部实现,以及实践过程中的经验。专题篇——介绍分布式系统的主要应用:云存储和大数据,这些是近年来的热门领域,本书介绍了云存储平台、技术与安全,以及大数据的概念、流式计算、实时分析等。

]

作者简介

[

  杨传辉 阿里巴巴高级技术专家,花名日照,OceanBase核心开发人员,对分布式系统的理论和工程实践有深刻理解。曾在百度作为核心成员参与类MapReduce系统、类Bigtable系统和百度分布式消息队列等底层基础设施架构工作。热衷于分布式存储和计算系统设计,乐于分享,有技术博客NosqlNotes(http://nosqlnotes.net)。

  阿里巴巴高级技术专家(OceanBase核心开发人员)撰写,阳振坤、章文嵩、杨卫华、汪源、余锋(褚霸)、赖春波等来自阿里巴巴、新浪、网易和百度的资深技术专家联袂推荐。

  系统讲解构建大规模存储系统的核心技术和原理,详细分析Google、Amazon、Microsoft和阿里巴巴的大规模分布式存储系统的原理。

  实战性强,通过对阿里巴巴的分布式数据库OceanBase的实现细节进行深入分析,全面讲解了大规模分布式存储系统的架构方法与应用实践。

]

目录

前言第1章 概述1.1 分布式存储概念1.2 分布式存储分类**篇 基础篇第2章 单机存储系统2.1 硬件基础2.1.1 cpu架构2.1.2 io总线2.1.3 网络拓扑2.1.4 性能参数2.1.5 存储层次架构2.2 单机存储引擎2.2.1 哈希存储引擎2.2.2 b树存储引擎2.2.3 lsm树存储引擎2.3 数据模型2.3.1 文件模型2.3.2 关系模型2.3.3 键值模型2.3.4 sql与nosql 2.4 事务与并发控制2.4.1 事务2.4.2 并发控制2.5 故障恢复2.5.1 操作日志2.5.2 重做日志2.5.3 优化手段2.6 数据压缩2.6.1 压缩算法2.6.2 列式存储第3章 分布式系统3.1 基本概念3.1.1 异常3.1.2 一致性3.1.3 衡量指标3.2 性能分析3.3 数据分布3.3.1 哈希分布3.3.2 顺序分布3.3.3 负载均衡3.4 复制3.4.1 复制的概述3.4.2 一致性与可用性3.5 容错3.5.1 常见故障3.5.2 故障检测3.5.3 故障恢复3.6 可扩展性3.6.1 总控节点3.6.2 数据库扩容3.6.3 异构系统3.7 分布式协议3.7.1 两阶段提交协议3.7.2 paxos协议3.7.3 paxos与2pc3.8 跨机房部署第二篇 范型篇第4章 分布式文件系统4.1 google文件系统4.1.1 系统架构4.1.2 关键问题4.1.3 master设计4.1.4 chunkserver设计4.1.5 讨论4.2 taobao file system4.2.1 系统架构4.2.2 讨论4.3 facebook haystack4.3.1 系统架构4.3.2 讨论4.4 内容分发网络4.4.1 cdn架构4.4.2 讨论第5章 分布式键值系统5.1 amazon dynamo5.1.1 数据分布5.1.2 一致性与复制5.1.3 容错5.1.4 负载均衡5.1.5 读写流程5.1.6 单机实现5.1.7 讨论5.2 淘宝tair5.2.1 系统架构5.2.2 关键问题5.2.3 讨论第6章 分布式表格系统6.1 google bigtable6.1.1 架构6.1.2 数据分布6.1.3 复制与一致性6.1.4 容错6.1.5 负载均衡6.1.6 分裂与合并6.1.7 单机存储6.1.8 垃圾回收6.1.9 讨论6.2 google megastore6.2.1 系统架构6.2.2 实体组6.2.3 并发控制6.2.4 复制6.2.5 索引6.2.6 协调者6.2.7 读取流程6.2.8 写入流程6.2.9 讨论6.3 windows azure storage6.3.1 整体架构6.3.2 文件流层6.3.3 分区层6.3.4 讨论第7章 分布式数据库7.1 数据库中间层7.1.1 架构7.1.2 扩容7.1.3 讨论7.2 microsoft sql azure7.2.1 数据模型7.2.2 架构7.2.3 复制与一致性7.2.4 容错7.2.5 负载均衡7.2.6 多租户7.2.7 讨论7.3 google spanner7.3.1 数据模型7.3.2 架构7.3.3 复制与一致性7.3.4 truetime7.3.5 并发控制7.3.6 数据迁移7.3.7 讨论第三篇 实践篇第8章 oceanbase架构初探8.1 背景简介8.2 设计思路8.3 系统架构8.3.1 整体架构图8.3.2 客户端8.3.3 rootserver8.3.4 mergeserver8.3.5 chunkserver8.3.6 updateserver8.3.7 定期合并&数据分发8.4 架构剖析8.4.1 一致性选择8.4.2 数据结构8.4.3 可靠性与可用性8.4.4 读写事务8.4.5 单点性能8.4.6 ssd支持8.4.7 数据正确性8.4.8 分层结构第9章 分布式存储引擎 9.1 公共模块9.1.1 内存管理9.1.2 基础数据结构9.1.3 锁9.1.4 任务队列9.1.5 网络框架9.1.6 压缩与解压缩9.2 rootserver实现机制9.2.1 数据结构9.2.2 子表复制与负载均衡9.2.3 子表分裂与合并9.2.4 updateserver选主9.2.5 rootserver主备9.3 updateserver实现机制9.3.1 存储引擎9.3.2 任务模型9.3.3 主备同步9.4 chunkserver实现机制9.4.1 子表管理9.4.2 sstable9.4.3 缓存实现9.4.4 io实现9.4.5 定期合并&数据分发9.4.6 定期合并限速9.5 消除更新瓶颈9.5.1 读写优化回顾9.5.2 数据旁路导入9.5.3 数据分区第10章 数据库功能10.1 整体结构10.2 只读事务10.2.1 物理操作符接口10.2.2 单表操作10.2.3 多表操作10.2.4 sql执行本地化10.3 写事务10.3.1 写事务执行流程10.3.2 多版本并发控制10.4 olap业务支持10.4.1 并发查询10.4.2 列式存储10.5 特色功能10.5.1 大表左连接10.5.2 数据过期与批量删除第11章 质量保证、运维及实践11.1 质量保证11.1.1 rd开发11.1.2 qa测试11.1.3 试运行11.2 使用与运维11.2.1 使用11.2.2 运维11.3 应用11.3.1 收藏夹11.3.2 天猫评价11.3.3 直通车报表11.4 *佳实践11.4.1 系统发展路径11.4.2 人员成长11.4.3 系统设计11.4.4 系统实现11.4.5 使用与运维 11.4.6 工程现象11.4.7 经验法则第四篇 专题篇第12章 云存储12.1 云存储的概念12.2 云存储的产品形态12.3 云存储技术12.4 云存储的核心优势12.5 云平台整体架构12.5.1 amazon云平台12.5.2 google云平台12.5.3 microsoft云平台12.5.4 云平台架构12.6 云存储技术体系12.7 云存储安全第13章 大数据13.1 大数据的概念13.2 mapreduce13.3 mapreduce扩展13.3.1 google tenzing13.3.2 microsoft dryad13.3.3 google pregel13.4 流式计算13.4.1 原理13.4.2 yahoo s413.4.3 twitter storm13.5 实时分析13.5.1 mpp架构13.5.2 emc greenplum13.5.3 hp vertica13.5.4 google dremel参考资料

封面

大规模分布式存储系统-原理解析与架构实战

书名:大规模分布式存储系统-原理解析与架构实战

作者:杨传辉 著

页数:293

定价:¥59.0

出版社:机械工业出版社

出版日期:2013-09-01

ISBN:9787111430520

PDF电子书大小:83MB 高清扫描完整版

百度云下载:http://www.chendianrong.com/pdf

发表评论

邮箱地址不会被公开。 必填项已用*标注