数据挖掘原理与实践

本书特色

[

  《高等学校计算机规划教材:数据挖掘原理与实践》分为数据挖掘理论和数据挖掘实践两大部分。基础理论部分的主要内容包括数据挖掘的基本概念、数据挖掘的预处理、聚类分析、分类与回归、关联规则挖掘、例外点检测。数据挖掘实践部分讨论了数据挖掘在通信行业、文本挖掘等方面的实际应用;通过四个案例展示了在通信行业中如何利用数据挖掘进行客户细分、客户流失分析、客户社会关系挖掘、业务交叉销售;通过跨语言智能学术搜索系统和基于内容的垃圾邮件识别两个案例展示了数据挖掘在文本挖掘方面的应用。

  《高等学校计算机规划教材:数据挖掘原理与实践》可作为高等院校计算机电子商务及相关专业的学生相关的教材或参考书,也可供从事数据挖掘研究、设计等工作的科研、技术人员参考。

]

目录

上篇 理论篇第1章 绪论1.1 数据挖掘产生的背景1.2 数据挖掘任务及过程1.2.1 数据挖掘定义1.2.2 数据挖掘对象1.2.3 数据挖掘任务1.2.4 数据挖掘过程1.2.5 数据挖掘常用软件简介1.3 数据挖掘应用1.3.1 数据挖掘在商业领域中的应用1.3.2 数据挖掘在计算机领域中的应用1.3.3 其他领域中的应用1.4 数据挖掘技术的前景、研究热点1.4.1 数据挖掘技术的价值和前景1.4.2 数据挖掘的研究热点1.4.3 数据挖掘的未来发展本章小结习题1 第2章 数据处理基础2.1 数据2.1.1 数据及数据类型2.1.2 数据集的类型2.2 数据统计特性2.2.1 数据的中心度量2.2.2 数据散布程度度量2.3 数据预处理2.3.1 数据清理2.3.2 数据聚合2.3.3 数据变换2.3.4 数据归约2.4 相似性度量2.4.1 属性之间的相似性度量2.4.2 对象之间的相似性度量2.5 本章小结习题2 第3章 分类与回归3.1 概述3.2 决策树分类方法3.2.1 决策树的基本概念3.2.2 决策树的构建3.2.3 id3分类算法3.2.4 c4.5分类算法3.2.5 cart算法3.3 贝叶斯分类方法3.3.1 贝叶斯定理3.3.2 朴素贝叶斯分类算法3.4 k-*近邻分类方法3.4.1 k-*近邻分类算法基本概念3.4.2 k-*近邻分类算法描述3.4.3 k-*近邻分类算法的优缺点3.5 神经网络分类方法3.5.1 人工神经网络的基本概念3.5.2 典型神经网络模型介绍3.5.3 神经网络的优缺点3.6 支持向量机3.7 集成学习法3.8 不平衡类问题3.9 分类模型的评价3.9.1 分类模型性能评价指标3.9.2 分类模型的过分拟合3.9.3 评估分类模型性能的方法3.10 回归3.10.1 线性回归3.10.2 非线性回归3.10.3 逻辑回归3.11 本章小结习题3 第4章 聚类分析4.1 概述4.1.1 聚类分析研究的主要内容4.1.2 数据挖掘对聚类算法的要求4.1.3 典型聚类方法简介4.2 基于划分的聚类算法4.2.1 基本k-means聚类算法4.2.2 二分k-means算法4.2.3 k-means聚类算法的拓展4.2.4 k-medoids算法4.3 层次聚类算法4.3.1 birch算法4.3.2 cure算法4.3.3 rock算法4.4 基于密度的聚类算法4.5 基于图的聚类算法4.5.1 chameleon聚类算法4.5.2 基于snn的聚类算法4.6 一趟聚类算法4.6.1 算法描述4.6.2 聚类阈值的选择策略4.7 基于模型的聚类算法4.7.1 期望*大化方法em4.7.2 概念聚类4.7.3 som方法4.8 聚类算法评价本章小结习题4 第5章 关联分析5.1 概述5.2 频繁项集发现算法5.2.1 apriori 算法5.2.2 fp-growth算法5.3 关联规则的生成5.4 非二元属性的关联规则挖掘5.5 关联规则的评价5.5.1 支持度和置信度5.5.2 相关性分析5.5.3 辛普森悖论5.6 序列模式5.6.1 问题描述5.6.2 序列模式发现算法5.7 本章小结习题 第6章 离群点挖掘6.1 概述6.2 基于统计的方法6.3 基于距离的方法6.4 基于相对密度的方法6.5 基于聚类的方法6.5.1 基于对象离群因子的方法6.5.2 基于簇的离群因子方法6.5.3 基于聚类的动态数据离群点检测6.6 离群点挖掘方法的评估6.7 本章小结习题下篇 实践篇 第7章 数据挖掘在电信业中的应用7.1 数据挖掘在电信业的应用概述7.1.1 客户细分7.1.2 客户流失预测分析7.1.3 客户社会关系挖掘7.1.4 业务交叉销售7.1.5 欺诈客户识别7.2 案例一: 客户通话模式分析7.2.1 概述7.2.2 数据描述7.2.3 数据预处理7.2.4 发现之旅7.3 案例二:基于通话数据的社会网络分析7.3.1 概述7.3.2 客户呼叫图的构建7.3.3 客户呼叫图的一般属性及其应用7.3.4 客户呼叫图的社区发现及应用7.4 案例三:客户细分与流失分析7.4.1 概述7.4.2 数据准备7.4.3 数据预处理7.4.4 客户聚类分析7.4.5 建立分类预测模型7.4.6 模型评估与调整优化7.5 案例四:移动业务关联分析7.5.1 概述7.5.2 数据准备7.5.3 数据预处理7.5.4 关联规则挖掘过程7.5.5 规则的优化7.5.5 模型的应用7.6 本章小结 第8章 文本挖掘与web数据挖掘8.1 文本挖掘8.1.1 分词8.1.2 文本表示与词权重计算8.1.3 文本特征选择8.1.4 文本分类8.1.5 文本聚类8.1.6 文档自动摘要8.2 web数据挖掘8.2.1 web内容挖掘8.2.2 web使用挖掘8.2.3 web结构挖掘8.3 案例五——跨语言智能学术搜索系统8.3.1 混合语种文本分词8.3.2 基于机器翻译的跨语言信息检索8.3.3 不同语种文本的搜索结果聚类8.3.4 基于聚类的个性化信息检索8.3.5 基于聚类的查询扩展8.3.6 其他检索便利工具8.3.7 系统性能评估8.4 案例六——基于内容的垃圾邮件识别8.4.1 垃圾邮件识别方法简介8.4.2 基于内容的垃圾邮件识别方法工作原理8.4.3 一种基于聚类的垃圾邮件识别方法8.5 本章小结参考文献

封面

数据挖掘原理与实践

书名:数据挖掘原理与实践

作者:蒋盛益

页数:271

定价:¥35.0

出版社:电子工业出版社

出版日期:2013-02-01

ISBN:9787121140501

PDF电子书大小:150MB 高清扫描完整版

百度云下载:http://www.chendianrong.com/pdf

发表评论

邮箱地址不会被公开。 必填项已用*标注