大数据技术丛书APACHE KYLIN权威指南(第2版)

本书特色

[

本书由Apache Kylin核心开发团队编写,近两年Apache Kylin随着社区持续贡献的热度和在不同领域业务场景的深入实践应用,新的功能和特性不断涌现,这样就迫切需要更新内容来满足广大Apache Kylin 的使用者和关注人群的需要。本书从Apache Kylin的架构和设计,各个模块的使用,与第三方的整合,二次开发以及开源实践等各个方面进行讲解,为各位读者呈现*核心的设计理念和哲学、算法和技术等。

]

内容简介

[

本书由Apache Kylin核心开发团队编写,近两年Apache Kylin随着社区持续贡献的热度和在不同领域业务场景的深入实践应用,新的功能和特性不断涌现,这样就迫切需要更新内容来满足广大Apache Kylin 的使用者和关注人群的需要。本书从Apache Kylin的架构和设计,各个模块的使用,与第三方的整合,二次开发以及开源实践等各个方面进行讲解,为各位读者呈现*核心的设计理念和哲学、算法和技术等。

]

目录

推荐序前 言第1章 Apache Kylin概述11.1 背景和历史11.2 Apache Kylin的使命31.2.1 为什么要使用Apache Kylin31.2.2 Apache Kylin怎样解决关键问题41.3 Apache Kylin的工作原理51.3.1 维度和度量简介51.3.2 Cube和Cuboid61.3.3 工作原理71.4 Apache Kylin的技术架构71.5 Apache Kylin的主要特点91.5.1 标准SQL接口91.5.2 支持超大数据集101.5.3 亚秒级响应101.5.4 可伸缩性和高吞吐率101.5.5 BI及可视化工具集成111.6 与其他开源产品的比较111.7 小结13第2章 快速入门 142.1 核心概念 142.1.1 数据仓库、OLAP与BI142.1.2 维度建模152.1.3 事实表和维度表162.1.4 维度和度量162.1.5 Cube、Cuboid和Cube Segment162.2 在Hive中准备数据 172.2.1 多维数据模型172.2.2 维度表的设计 172.2.3 Hive表分区 182.2.4 了解维度的基数 182.2.5 样例数据182.3 安装和启动Apache Kylin192.3.1 环境准备192.3.2 必要组件192.3.3 启动Apache Kylin192.4 设计Cube 192.4.1 导入Hive表定义192.4.2 创建数据模型212.4.3 创建Cube232.5 构建Cube 322.5.1 全量构建和增量构建342.5.2 历史数据刷新352.5.3 合并362.6 查询Cube 382.6.1 Apache Kylin查询介绍382.6.2 查询下压402.7 SQL参考 412.8 小结41第3章 Cube优化423.1 Cuboid剪枝优化423.1.1 维度的组合423.1.2 检查Cuboid数量433.1.3 检查Cube大小453.1.4 空间与时间的平衡463.2 剪枝优化工具473.2.1 使用衍生维度473.2.2 聚合组493.2.3 必需维度513.2.4 层级维度513.2.5 联合维度523.3 并发粒度优化543.4 Rowkey优化553.4.1 调整Rowkey顺序553.4.2 选择合适的维度编码563.4.3 按维度分片573.5 Top_N度量优化583.6 Cube Planner优化613.7 其他优化623.7.1 降低度量精度623.7.2 及时清理无用Segment633.8 小结63第4章 增量构建644.1 为什么要增量构建644.2 设计增量Cube664.2.1 设计增量Cube的条件664.2.2 增量Cube的创建674.3 触发增量构建694.3.1 Web GUI触发694.3.2 构建相关的REST API704.4 管理Cube碎片764.4.1 合并Segment764.4.2 自动合并774.4.3 保留Segment794.4.4 数据持续更新794.5 小结80第5章 查询和可视化815.1 Web GUI815.1.1 查询815.1.2 显示结果825.2 REST API845.2.1 查询认证855.2.2 查询请求参数855.2.3 查询返回结果865.3 ODBC875.4 JDBC905.4.1 获得驱动包905.4.2 认证905.4.3 URL格式905.4.4 获取元数据信息915.5 Tableau集成915.5.1 连接Kylin数据源925.5.2 设计数据模型935.5.3 “Live”连接935.5.4 自定义SQL945.5.5 可视化展现945.5.6 发布到Tableau Server955.6 Zeppelin集成955.6.1 Zeppelin架构简介955.6.2 KylinInterpreter的工作原理965.6.3 如何使用Zeppelin访问Kylin965.7 Superset 集成985.7.1 下载Kylinpy985.7.2 安装Superset995.7.3 在Superset中添加Kylin Database1005.7.4 在Superset中添加Kylin Table1005.7.5 在Superset中创建图表1035.7.6 在Superset中通过SQL Lab探索Kylin1055.8 QlikView 集成1065.8.1 连接Kylin数据源1065.8.2 “Direct Query”连接1075.8.3 创建可视化1095.8.4 发布到QlikView Server1105.9 Qlik Sense集成1105.9.1 连接Kylin数据源1105.9.2 “Direct Query”连接1125.9.3 创建可视化1145.9.4 发布到Qlik Sense Hub1155.9.5 在Qlik Sense Hub中连接Kylin数据源1175.10 Redash集成1185.10.1 连接Kylin数据源1185.10.2 新建查询1195.10.3 新建仪表盘1215.11 MicroStrategy 集成1225.11.1 创建数据库实例1235.11.2 导入逻辑表1245.11.3 创建属性、事实和度量1245.11.4 创建报告1245.11.5 MicroStrategy连接Kylin*佳实践1265.12 小结127第6章 Cube Planner及仪表盘1286.1 Cube Planner1286.1.1 为什么要引入Cube Planner1286.1.2 Cube Planner 算法介绍1296.1.3 使用Cube Planner1316.2 System Cube1346.2.1 开启System Cube1346.2.2 构建和更新System Cube1356.3 仪表盘1356.4 小结137第7章 流式构建1387.1 为什么要进行流式构建1397.2 准备流式数据1397.2.1 数据格式1397.2.2 消息队列1407.2.3 创建Schema1417.3 设计流式Cube1447.3.1 创建Model1447.3.2 创建Cube1457.4 流式构建原理1477.5 触发流式构建1507.5.1 单次触发构建1517.5.2 自动化多次触发1527.5.3 初始化构建起点1527.5.4 其他操作1537.5.5 出错处理1537.6 小结154第8章 使用Spark1558.1 为什么要引入Apache Spark1558.2 Spark构建原理1568.3 使用Spark构建Cube1588.3.1 配置Spark引擎1

封面

大数据技术丛书APACHE KYLIN权威指南(第2版)

书名:大数据技术丛书APACHE KYLIN权威指南(第2版)

作者:Apache Kylin核心团队

页数:291

定价:¥99.0

出版社:机械工业出版社

出版日期:2018-04-01

ISBN:9787111633297

PDF电子书大小:74MB 高清扫描完整版

百度云下载:http://www.chendianrong.com/pdf

发表评论

邮箱地址不会被公开。 必填项已用*标注