多根层次数据分布模型:论大数据时代的数据管理

本书特色

[

人类进入信息社会大数据时代,传统数据管理面临很多挑战,数据管理正面临一场科学革命。本书从大数据发展现状出发,在人类DIKW知识层次中认识“数据”,阐述大数据时代以数据为中心的必然性,进而提出数据管理的新范式,即以系统科学及开放复杂巨系统为主要特征的范式,并论述数据管理正在向新范式转换;为解决数据系统中众多管理问题,从数据语义出发给出数据分布模型概念,并论述其是大数据时代数据管理的核心与基础;定义了一种数据分布模型——MHM;另外,本书还涉及数据管理的几个主要方面,包括数据一致性、事务处理、访问控制、扩展性等,实验表明MHM在性能、可靠性方面的优势,同时讨论MHM潜在的适用范围。

]

内容简介

[

本书从大数据发展现状出发, 在人类DIKW知识层次中认识“数据”, 阐述大数据时代以数据为中心的必然性, 进而提出数据管理的新范式, 即以系统科学及开放复杂巨系统为主要特征的范式, 并论述数据管理正在向新范式转换 ; 为解决数据系统中众多管理问题, 从数据语义出发给出数据分布模型概念, 并论述其是大数据时代数据管理的核心与基础 ; 定义了一种数据分布模型 —— MHM。

]

目录

目录前言第1章 导论 11.1 数据管理面临着一场科学革命 11.2 社会数据管理 31.3 数据分布模型 71.4 本书的组织结构 9**篇 大数据时代的数据管理第2章 数据管理的现状 132.1 云计算及云数据管理 132.2 大数据简介 162.3 大数据的社会影响 182.4 大数据的困境及思考 20第3章 数据在DIKW体系中的地位 233.1 信息 233.2 数据 243.3 信息与数据的关系 263.3.1 谁是**性 263.3.2 在认识论中把握信息与数据 273.3.3 信息**性的意义 303.4 知识 313.5 智慧 323.6 转识成智 353.7 认识数据、信息、知识、智慧、道德关系的意义 37第4章 以教据为中心组织计算 404.1 不同类型数据的关系 404.1.1 数据质量 404.1.2 结构化、非结构化、半结构化数据 404.1.3 三类数据的层次关系 414.2 Hadoop与大数据处理 434.3 Hadoop与数据管理 444.4 以数据为中心的必然性 46第5章 数据管理的新范式 495.1 数据管理的科学革命 495.2 数据管理的范式转变 535.2.1 库恩范式与格雷范式 535.2.2 数据管理新范式——系统科学范式 555.2.3 开放的复杂巨系统 585.2.4 数据管理的再认识 605.3 数据管理技术的调整与变更 625.3.1 本地封闭世界假设 635.3.2 数据的*终一致性 645.3.3 CAP与BASE 665.3.4 事务 675.4 系统科学范式下的数据组织与控制 735.4.1 数据的组织结构与数据模型 735.4.2 多根树 745.4.3 基于多根树的数据组织 755.4.4 基于多根树的数据控制 77第二篇 数据模型与数据分布模型第6章 大数据时代的数据模型 856.1 常用的数据模型 856.1.1 层次模型 856.1.2 网状模型 866.1.3 关系模型 866.1.4 半结构化数据模型与XML 876.1.5 面向对象的数据模型 886.2 典型应用 896.2.1 数据仓库 896.2.2 DNS数据库 896.2.3 几个大规模数据存储管理系统 916.2.4 key value存储 956.2.5 大数据数据模型 1006.3 ER模型及其表达能力 1016.4 影响数据模型选择的因素 103第7章 数据分布 1067.1 数据分布的单位 1067.1.1 数据分布以文件为单位 1067.1.2 数据分布以片段为单位 1067.1.3 数据分布以key-value对为单位 1077.2 数据分布面临的挑战 1077.3 依赖于数据分布的管理方面 1107.3.1 查询处理 1107.3.2 数据一致性、事务的实现 1117.3.3 安全访问控制 1117.3.4 扩展性 1117.3.5 并行处理 1127.3.6 可用性 1127.3.7 其他 112第8章 数据分布模型 1138.1 没有数据分布模型的困难 1138.1.1 系统通用性变差 1138.1.2 应用系统开发效率低下 1148.1.3 跨系统管理困难 1148.1.4 系统进化困难 1158.1.5 大数据管理系统难以落地 1168.2 构建数据分布模型的可能性 1168.2.1 数据分布模型特点 1168.2.2 ER模型是数据模型的概念基础 ll78.2.3 现实世界是分布式存在、层次管理的 ll88.2.4 复杂信息管理系统的核心与基础 1198.2.5 社会发展的必然结果 1208.3 数据分布模型要考虑的因素 1218.3.1 性能 1218.3.2 多种因素的平衡 1228.3.3 数据的语义 1248.3.4 系统学的基本原理 1258.3.5 可变性 1278.3.6 简单性 1288.3.7 定性与定量的统一 129第三篇 多根层次数据分布模型MHM第9章 MHM的提出 1339.1 基于多根树的MHM 1339.2 从图到多根树 l359.2.1 数据图中的菱形与回路 1359.2.2 模式图与数据图之间的关系 l369.2.3 将数据图近似成多根树 1379.3 祖先完整性与控制完整性 l389.3.1 祖先完整性 1389.3.2 控制完整性 1389.3.3 祖先完整性与控制完整性的现实意义 1409.4 多根树的操作及现实意义 1419.4.1 并 1419.4.2 差 1439.4.3 交 1449.4.4 缩窄 1449.4.5 融合 1479.4.6 提取 1489.4.7 基线 150第10章 MHM与数据分布 15410.1 MHM作为数据分布模型 l5410.1.1 控制节点选取的原则 15410.1.2 与其他数据模型的区别 l5510.2 基于MHM的数据分布例子 15610.3 基于非关系数据模型的MHM l5910.3.1 基于XML的MHM 15910.3.2 基于层次数据模型的MHM 15910.3.3 基于网状数据模型的MHM 15910.3.4 基于key value的MHM 160第11章 MHM与系统科学范式 16111.1 MHM与系统科学原理 16111.1.1 MHM的整体性 16111.1.2 MHM的层次性 16211.1.3 MHM的开放性 16311.1.4 MHM的目的性 16311.1.5 MHM的突变性 16411.1.6 MHM的稳定性 l6511.1.7 MHM的自组织性 16511.1.8 MHM的相似性 l6511.2 MHM与系统论规律 16611.2.1 MHM与结构功能相关律 l6611.2.2 MHM与信息反馈律 16611.2.3 MHM与竞争协同律 16711.2.4 MHM与涨落有序律 16711.2.5 MHM与优化演化律 167第四篇 基于MHM的数据管理第12章 基于MHM的数据一致性 17112.1 数据一致性与数据溯源 17112.2 物理时间戳与逻辑时间戳 17412.3 基于模糊物理时间戳的多版本 17512.4 引用数据的复制 17712.4.1 引用数据的异步复制 17712.4.2 引用数据复制与完整性约束 17812.4.3 几点说明 l79第13章 基于MHM的事务处理 18213.1 基于本地封闭式世界假设的事务模型 l8213.2 数据*终一致性对事务的支持 18413.3 基于MHM的事务的隔离性级别 l8713.4 不一致性与隔离性级别 18913.5 事务提交与撤销 190第14章 MHM可用性 19214.1 跨层访问 19214.2 多根树复制 19314.2.1 多根树复制 19314.2.2 多根树缓存 19414.3 副本更新 195第15章 基于MHM的访问控制 19715.1 大规模分布式系统的访问控制 19715.2 用户&区域 19815.3 基于数据域的访问控制模型 20115.4 基于MHM访问控制示例 20215.4.1 在TPGC中应用 20215.4.2 —个实际项目中的应用 204第16章 MHM扩展性 20616.1 扩展性与性能 20616.2 扩展性与效率 20916.3 MHM的扩展性 21016.3.1 扩展的实现 21016.3.2 基于MHM的TPC C扩展性 212第17章 MHM的性能实验及适用范围 21417.1 TPC C应用例子 21417.1.1 基于MHM的性能实验环境 21417.1.2 TPGC实验结果 21617.1.3 实验结果分析 21817.2 MHM适用范围 21817.2.1 数据仓库 21817.2.2 电商数据库 22017.2.3 社交网络数据库 22l17.2.4 无线传感器网络数据库 22317.2.5 移动数据库 22417.2.6 GIS数据库 225参考文献 226插图目录图4.1 数据金字塔 42图5.1 数据系统示例 64图5.2 多根树例子 74图5.3 买家卖家模式图 76图5.4 单根控制 78图5.5 多根独立控制 79图5.6 买家多根主辅控制 80图5.7 卖家多根主辅控制 80图5.8 联合控制 81图6.1 ER图中的时间 103图9.1 子结构特征 135图9.2 Empi是个孤立点 139图9.3 多根树:并、交、差 142图9.4 缩窄 146图9.5 融合 147图9.6 多根树提取 149图9.7 基线 152图10.1 TPGC模式 157图10.2 服务器间架构 157图12.1 模糊时间戳 177图13.1 模糊时间戳与事务一致性 186图14.1 跨层访问 192图14.2 透明访问 193图15.1 服务器&区域 199图15.2 TPC C架构例子 203图15.3 权限管理实例 205图16.1 TPGC扩展 213图17.1 性能实验环境 215图17.2 *大的TPM 217图17.3 24节点不同并行活动的TPM 217表格目录表13.1 隔离性级别 190表15.1 各区域中的用户 204

封面

多根层次数据分布模型:论大数据时代的数据管理

书名:多根层次数据分布模型:论大数据时代的数据管理

作者:张建英著

页数:237页

定价:¥89.0

出版社:科学出版社

出版日期:2017-05-01

ISBN:9787030525710

PDF电子书大小:73MB 高清扫描完整版

百度云下载:http://www.chendianrong.com/pdf

发表评论

邮箱地址不会被公开。 必填项已用*标注