数据仓库与数据挖掘教程

本书特色

[

本书较详细地介绍了数据仓库和数据挖掘的原理、方法及应用技术。全书共有14章,分为4篇。第1章为绪论篇,介绍数据仓库与数据挖掘的基本概念及其相互关系; 第2~6章为数据仓库原理及应用篇,主要介绍数据仓库的概念模型、逻辑模型和物理模型,以及数据仓库的规划、设计、实施和olap应用等; 第7~10章为传统数据挖掘原理及算法篇,介绍数据的属性类型与相似性度量、关联规则挖掘、分类规则挖掘、聚类分析和离群点挖掘算法等; 第11~14章为数据挖掘创新篇,主要内容取自编者近年指导研究生发表的学术论文,并根据教学需要进行适当补充修改而成,包括混合属性数据、数据流和不确定数据的聚类分析,以及量子遗传聚类算法等。
本书可作为普通高等院校计算机专业与it相关专业高年级本科生和研究生的教材,也可作为经济管理类专业同名课程的教材和参考书,还可作为电子商务、金融保险等行业数据管理与数据分析人员的培训教材或自学参考书。

]

内容简介

[

兼顾应用型人才与学术型人才的培养需求;有机融合传统理论方法与创新思想方法;理论叙述深入浅出,实际应用具体完整;算法描述自然易懂,计算实例详略得当。 

]

目录

目录第1章绪论1.1数据仓库概述1.1.1从传统数据库到数据仓库1.1.2数据仓库的4个特征1.1.3数据仓库系统1.1.4数据仓库系统体系结构1.1.5数据仓库数据的粒度与组织1.2数据挖掘概述1.2.1数据挖掘产生的背景1.2.2数据挖掘与知识发现1.2.3数据挖掘的数据来源1.2.4数据挖掘的任务1.2.5数据挖掘的步骤1.2.6数据挖掘的应用1.3数据仓库与数据挖掘1.3.1数据仓库与数据挖掘的区别1.3.2数据仓库与数据挖掘的关系1.4教程章节组织与学时建议习题1第2章数据仓库原理2.1多数据源问题2.2数据预处理2.2.1数据清洗2.2.2数据变换2.2.3数据归约2.3e�瞨模型2.4数据仓库的概念模型2.4.1多维数据模型2.4.2维度与粒度2.5数据仓库的逻辑模型2.5.1多维数据库系统2.5.2星形模型2.5.3雪花模型2.6数据仓库的物理模型2.6.1位图索引模型2.6.2广义索引模型2.6.3连接索引模型2.6.4raid存储结构习题2第3章数据仓库的设计开发应用3.1数据仓库设计的特点3.2数据仓库系统开发过程3.3数据仓库系统的规划3.4数据仓库的设计3.4.1需求分析3.4.2概念设计3.4.3逻辑设计3.4.4物理设计3.5数据仓库的实施3.5.1数据仓库的创建3.5.2数据的抽取、转换和加载3.6数据仓库系统的开发3.6.1开发任务3.6.2开发方法3.6.3系统测试3.7数据仓库系统的应用3.7.1用户培训3.7.2决策支持3.7.3维护评估习题3第4章警务数据仓库的实现4.1sql server 2008 r24.1.1sql server的服务功能4.1.2sql server management studio4.1.3microsoft visual studio4.2创建集成服务项目与ssis包4.3配置“旅馆_etl”数据流任务4.3.1创建“旅馆_etl”对象4.3.2配置“旅馆_etl”参数4.4配置“人员_etl”数据流任务4.4.1创建“人员_etl”对象4.4.2配置“人员_etl”参数4.5配置“时间_etl”数据流任务4.5.1创建“时间_etl”对象4.5.2配置“时间_etl”参数4.6配置“入住_etl”数据流任务4.6.1创建“入住_etl”对象4.6.2配置“入住_etl”参数4.7部署前面配置的ssis包4.7.1将包另存到ssis服务器4.7.2创建作业代理习题4第5章联机分析处理技术5.1olap概述5.1.1olap的定义5.1.2olap的12条准则5.1.3olap的简要准则5.1.4olap系统的基本结构5.2olap的多维分析操作5.2.1切片5.2.2切块5.2.3旋转5.2.4钻取5.3olap系统的分类5.3.1多维olap5.3.2关系olap5.3.3molap与rolap的比较5.3.4混合olap5.4olap、dw与dm的关系5.4.1olap、dw与dm的联系5.4.2olap、dw与dm的区别5.4.3olap与dw的关系5.4.4olap与dm的关系5.5dolam决策支持系统方案习题5第6章警务数据仓库的olap应用6.1创建分析服务项目6.1.1进入商业智能开发平台6.1.2创建分析服务项目6.2配置项目的数据源6.3构建数据源视图6.4创建多维数据集6.5配置维的层次结构6.5.1配置日期维的层次6.5.2配置地址维的层次6.5.3配置人员维的层次6.5.4配置旅馆维的层次6.6添加人口来源地址维6.7分析服务项目的部署6.8浏览多维数据集习题6第7章数据的属性与相似性7.1数据集的结构7.1.1二维表7.1.2数据矩阵7.2属性的类型7.2.1连续属性7.2.2离散属性7.2.3分类属性7.2.4二元属性7.2.5序数属性7.2.6数值属性7.3相似度与相异度7.3.1数值属性的距离7.3.2分类属性的相似度7.3.3余弦相似度7.3.4混合属性的相异度习题7第8章关联规则挖掘8.1关联规则的概念8.1.1基本概念8.1.2项集的性质8.2关联规则的apriori算法8.2.1发现频繁项集8.2.2产生关联规则8.3fp�苍龀に惴�8.3.1算法的背景8.3.2构造fp�彩�8.3.3生成频繁项集8.4关联规则的评价8.4.1支持度和置信度的不足8.4.2相关性分析8.5序列模式发现算法8.5.1序列模式的概念8.5.2类apriori算法8.6关联规则其他算法8.6.1频繁项集算法优化8.6.2close算法8.6.3时态关联规则8.6.4含负项的关联规则习题8第9章分类规则挖掘9.1分类问题概述9.2k��*近邻分类法9.3决策树分类方法9.3.1决策树生成框架9.3.2id3分类方法9.3.3决策树的剪枝9.3.4c4.5算法9.4贝叶斯分类方法9.4.1贝叶斯定理9.4.2朴素贝叶斯分类器9.4.3朴素贝叶斯分类方法的改进9.5其他分类方法习题9第10章聚类分析方法10.1聚类分析原理10.1.1聚类分析概述10.1.2聚类的数学定义10.1.3簇的常见类型10.1.4聚类框架及性能要求10.1.5簇的距离10.2划分聚类算法10.2.1划分聚类框架10.2.2划分聚类的质量10.2.3k�瞞eans算法10.2.4空簇与离群点10.2.5k�仓行牡闼惴�10.3层次聚类方法10.3.1层次聚类策略10.3.2agnes算法10.3.3diana算法10.4密度聚类方法10.4.1基本概念10.4.2算法描述10.4.3计算实例10.4.4算法的性能分析10.5聚类的质量评价10.5.1簇的数目估计10.5.2外部质量评价10.5.3内部质量评价10.6离群点挖掘10.6.1相关问题概述10.6.2基于距离的方法10.6.3基于相对密度的方法10.7其他聚类方法习题10第11章混合属性数据的聚类分析11.1混合属性数据集聚类11.1.1混合属性数据普遍存在11.1.2k�瞤rototypes算法11.1.3k�瞤rototypes算法的不足11.2改进的k�瞤rototypes算法11.2.1加权频率*大原型11.2.2离散属性的频率相异度11.2.3改进的k�瞤rototypes算法11.3强连通聚类融合算法11.3.1聚类融合方法11.3.2强连通聚类融合11.3.3聚类融合优化算法习题11第12章数据流挖掘与聚类分析12.1数据流挖掘的概念12.1.1数据流的定义12.1.2数据流挖掘的任务12.2数据流处理技术12.2.1概要数据结构12.2.2时间倾斜技术12.2.3数据流聚类的要求12.2.4数据流聚类的一般步骤12.3两层数据流聚类框架12.4三层数据流聚类框架12.5*优2k�步�邻聚类算法12.5.1算法设计动因12.5.2定义2k��*近邻集12.5.3在线2k��*近邻集生成12.5.4*优2k�步�邻集算法12.5.5*优2k�步�邻聚类算法12.5.6实例计算结果习题12第13章不确定数据的聚类分析13.1不确定数据挖掘概述13.1.1不确定数据的产生13.1.2不确定数据的种类13.1.3不确定数据的聚类13.2基于相对密度的不确定数据聚类算法13.2.1基于相对密度的聚类思想13.2.2不确定相异度与k��*近邻集13.2.3不确定k��*近邻密度13.2.4rdbcau算法描述13.2.5计算实例13.3不确定分类属性数据聚类算法13.3.1传统分类属性相似度13.3.2分类属性加权相似度13.3.3分类属性双重加权相似度13.3.4不确定分类属性双重加权相似度13.3.5基于连通分支的不确定分类属性聚类算法习题13第14章量子计算与量子遗传聚类算法14.1量子计算与数据挖掘14.1.1量子计算的诞生14.1.2量子计算研究14.1.3量子数据挖掘算法14.2量子计算原理14.2.1量子态与量子比特14.2.2量子门与基本运算14.2.3量子纠缠特性14.3经典量子算法14.3.1量子傅里叶变换14.3.2shor因子分解算法14.3.3grover算法14.4基于3d角度编码的量子遗传算法14.4.1量子遗传算法14.4.2量子3d角度编码14.4.3解空间的映射14.4.4量子染色体更新14.4.5量子位的变异14.4.6qgab3dc算法14.5量子遗传聚类算法14.5.1属性值q分位数与极差14.5.2基于极差的广义加权距离14.5.3量子遗传聚类算法习题14参考文献

封面

数据仓库与数据挖掘教程

书名:数据仓库与数据挖掘教程

作者:黄德才

页数:105

定价:¥54.9

出版社:清华大学出版社

出版日期:2016-08-01

ISBN:9787302434122

PDF电子书大小:31MB 高清扫描完整版

百度云下载:http://www.chendianrong.com/pdf

发表评论

邮箱地址不会被公开。 必填项已用*标注