数据流知识发现

内容简介

[

  面对“人们被数据淹没,却饥渴于知识”的挑战,数据挖掘和知识发现技术应运而生,并得以蓬勃发展。《数据流知识发现》全面介绍了数据流知识发现相关领域的研究内容,涵盖了五个主题:海量知识发现平台架构分析、数据流关联规则知识挖掘、数据流分类知识挖掘、数据流聚类知识挖掘以及数据流序列知识挖掘。  《数据流知识发现》可作为高等学校计算机专业的高年级本科生教材或研究生的教材,也可作为从事数据挖掘方面研究工作的科技工作者的参考资料。

]

目录

1 绪论1.1 什么是知识发现1.2 知识发现的过程1.3 新型数据流应用1.4 数据流定义及特点1.5 数据流知识发现1.5.1 数据流频繁模式挖掘1.5.2 数据流分类研究1.5.3 数据流聚类1.5.4 数据流离群点检测1.5.5 数据流时序数据分析1.6 海量数据管理与并行及分布式计算1.7 小结2 海量数据管理的关键技术2.1 海量数据硬件平台模型2.1.1 并行计算机体系结构2.1.2 集群并行计算系统2.1.3 虚拟化及云2.2 海量数据系统模型2.2.1 Hadoop框架2.2.2 Google Filc System-GFS2.2.3 Memcached2.2.4 SimpleDB2.3 海量数据计算的基本算法2.3.1 Map/Reduce2.3.2 BigTable2.3.3 NFS2.3.4 AFS2.4 传统海量数据管理技术2.4.1 并行数据划分2.4.2 并行事务调度N.4.3 并行事务并发控制算法2.5 数据流管理系统2.5.1 STREAM2.5.2 Aurora2.5.3 Medusa2.5.4 Borealis2.5.5 其他2.6 基于CPU和GPU的并行计算2.6.1 并行计算机和模型2.6.2 MPI+OpenMP混合模型2.6.3 基于GPU的并行计算模型2.6.4 基于CUDA的并行计算模型2.6.5 并行数据流分析2.7 小结3 数据流关联规则发现3.1 关联规则挖掘概述3.2 关联规则挖掘典型算法分析3.2.1 基于规则中涉及的数据维数的挖掘算法3.2.2 基于规则中涉及的抽象层次的挖掘算法3.2.3 按变量类别不同而确定的挖掘算法3.3 数据流上频集挖掘核心问题3.3.1 概要数据处理方法3.3.2 滑动窗口处理模型3.3.3 挖掘算法分类3.3.4 挖掘任务分类3.4 基于前缀树的频繁闭项集挖掘PFIT算法3.4.1 问题描述3.4.2 前缀树结构描述3.4.3 构建前缀树3.4.4 挖掘前缀树3.4.5 实验3.5 高效益项集挖掘算法FHUI-Growth3.5.1 关联规则效益度的定义及性质3.5.2 一种快速挖掘高效益项集的算法3.5.3 实验3.6 基于概念格的关联规则挖掘算法3.7 小结4 数据流分类知识发现4.1 数据分类模型与方法4.1.1 数据流单分类器算法4.1.2 数据流集成分类器算法4.2 基于隐马尔可夫模型的流数据分类算法4.2.1 基于隐马尔可夫模型的流数据分类算法4.2.2 马尔可夫链4.2.3 隐马尔可夫模型4.3 基于隐马尔可夫模型的流数据分类算法4.3.1 训练样本优化4.3.2 HMM_SDC算法4.3.3 实验4.3.4 结论4.4 小结5 数据流聚类挖掘5.1 引言5.2 聚类分析5.2.1 相关概念5.2.2 聚类分析中的数据类型5.2.3 主要聚类分析方法分类5.2.4 常见聚类分析方法的分析5.3 数据流聚类算法(methods and algorithms)5.3.1 STREAM算法5.3.2 CluStream算法框架5.3.3 HPStream算法框架5.3.4 E-Stream算法5.3.5 DenStrearn算法5.3.6 D-Stream算法5.3.7 CFR算法5.4 数据流滤波问题研究5.4.1 受系统参数影响的状态空间模型5.4.2 *小距离设计方法5.4.3 SSUKF-JSIMM算法思想5.4.4 SSUKF-JSIMM算法步骤5.4.5 仿真实验5.5 研究主题5.5.1 一般性主题5.5.2 面向具体应用领域的问题5.6 小结6 时序和序列数据流挖掘6.1 时间序列及其应用6.2 时间序列预测的常用方法6.3 时间序列的相似性搜索6.3.1 基于ARMA模型的时间序列相似性搜索6.3.2 基于离散傅里叶变换的时间序列相似性查找6.3.3 基于规范变换的查找方法6.4 序列模式挖掘简介6.5 序列模式挖掘算法6.5.1 Apriori算法6.5.2 基于划分的模式生长算法6.5.3 基于序列比较的算法6.6 支持约束的序列模式挖掘6.6.1 约束的分类6.6.2 支持约束的序列模式挖掘算法6.7 周期模式挖掘6.8 增量式序列模式挖掘6.9 序列模式挖掘算法的比较分析6.9.1 算法的定性比较6.9.2 算法的时间和空间执行效率比较6.9.3 算法适用范围分析6.10 序列挖掘在生物信息领域的应用6.10.1 蛋白质功能的计算方法简介6.10.2 一种改进的蛋白质功能预测方法PP_WNP[36]6.10.3 实验结果分析6.10.4 结论6.11 小结

封面

数据流知识发现

书名:数据流知识发现

作者:潘怡

页数:210页

定价:¥48.0

出版社:华中科技大学出版社

出版日期:2016-12-01

ISBN:9787568005272

PDF电子书大小:133MB 高清扫描完整版

百度云下载:http://www.chendianrong.com/pdf

发表评论

邮箱地址不会被公开。 必填项已用*标注