数据挖掘基础算法理论与Weka应用技术

本书特色

[

《数据挖掘基础算法理论与Weka应用技术》对数据挖掘领域的若干算法进行较为详尽的讨论,重点介绍算法的基本思想、数学原理和程序实现框架,同时介绍算法在开源工具Weka中的实现,对相关参数的含义和取值原则进行解读,以便初学者能直接运用Weka解决简单问题。在内容组织方面,《数据挖掘基础算法理论与Weka应用技术》以算法功能为主线,将算法划分为四个主要部分,包括分类方法、数值预测方法、聚类方法和基于频繁模式的关联规则方法。对于算法的介绍,《数据挖掘基础算法理论与Weka应用技术》注重相关算法之间的递进和承接关系,力求更清晰地呈现某类算法的发展历程和发展脉络,以期读者触类旁通,改进、发展、创造和实现满足实际应用场景需求的新方法。

]

内容简介

[

本书对数据控据领域的若干算法进行较为详尽的讨论, 重成介相算法的基本思想、数学原理和程序实现框架, 同时介超算法在开深工具wcka中的实现, 对相关参数的含义和取值原则进行解读, 以模相学者能直接运用Weka解决简单问题。在内容组织方面, 本书以算法功能为主线, 将算法划分为四个主要部分, 包指分类方法、数值预测方法、聚类方法和基于频繁模式的关联规则方法。对于算法的介绍, 本书法重相关算法之间的递进和承接关系, 力求更清晰地呈现某类算法的发展质程和发展脉络, 以期读者触类旁道, 改进、发展、创造和实现满足实际应用场景需求的新方法。

]

目录

目录第1章 绪论 11.1 数据挖掘 11.1.1 数据挖掘是什么 21.1.2 数据挖掘的功能 31.1.3 数据挖掘的过程 41.1.4 数据挖掘与机器学习 51.2 Weka简介 61.3 示例数据集 91.3.1 天气问题 91.3.2 鸢尾花问题 111.3.3 CPU性能问题 111.3.4 购物篮问题 121.3.5 美国国会投票记录 13第2章 认识数据 142.1 概念、实例集、属性 142.2 ARFF格式文件 16第3章 分类 203.1 分类器的输出与评价 203.1.1 汇总 203.1.2 成本敏感学习方案评价指标及工具 223.2 分类决策树 293.2.1 ID3算法 293.2.2 C4.5算法 313.2.3 带嫁接功能的C4.5算法 413.2.4 分类树与回归树 423.2.5 减少-误差剪枝决策树 493.3 分类规则 503.3.1 分类规则算法基本思想 503.3.2 分类规则算法的基本方法——覆盖算法 513.3.3 决策列表 593.3.4 基于全局优化的分类规则 633.3.5 基于例外的分类规则——涟波下降算法 663.3.6 单属性分类规则——1R分类算法 713.3.7 简单连接规则 753.3.8 简单分类规则 773.4 贝叶斯方法 773.4.1 贝叶斯方法基础 773.4.2 朴素贝叶斯方法 803.4.3 多项式朴素贝叶斯方法 903.4.4 贝叶斯网络 923.4.5 隐匿朴素贝叶斯方法 1213.5 分类函数 1253.5.1 logistic回归 1253.5.2 Winnow分类器 1343.5.3 多层感知机 1393.5.4 径向基函数网络 1563.5.5 序列*小优化算法 1603.5.6 核logistic回归 1793.5.7 投票感知机 1823.5.8 随机梯度下降算法 1843.6 惰性方法 1873.6.1 惰性方法的基本思想 1873.6.2 k-*近邻分类器 188第4章 数值预测 2194.1 预测器的输出与评价 2194.1.1 反映预测值与实际值之间**偏差的度量指标 2194.1.2 反映预测值与实际值之间相对偏差的度量指标 2194.2 预测规则 2204.2.1 简单连接规则 2204.2.2 简单分类规则——0-规则分类器 2214.3 预测函数 2224.3.1 线性回归 2224.3.2 简单线性回归 2294.3.3 *小中值平方线性回归 2294.3.4 基于投影的线性回归 2324.3.5 保序回归 2344.3.6 序列*小优化回归 241第5章 聚类 2475.1 K-均值聚类 2485.1.1 K-均值聚类的基本思想 2485.1.2 初始化聚类中心 2485.1.3 顶盖方法 2495.1.4 Weka实现 2555.2 X-均值聚类 2575.2.1 X-均值聚类的基本思想 2575.2.2 聚类簇总数k的估计 2575.2.3 基于kD树的算法加速 2605.2.4 Weka实现 2645.3 层次聚类 2655.3.1 层次聚类法的基本思想 2655.3.2 凝聚聚类算法 2665.3.3 Weka实现 2705.4 增量聚类 2715.4.1 增量聚类法的基本思想 2715.4.2 分类效用 2735.4.3 敏锐度 2745.4.4 截断参数 2755.4.5 Weka实现 2765.5 基于概率的聚类 2775.5.1 基于概率的聚类方法基础 2775.5.2 EM算法 2795.5.3 扩展混合模型 2815.5.4 交叉验证与聚类簇总数 2835.5.5 Weka实现 2835.6 基于密度的聚类 2855.6.1 基本概念 2855.6.2 DBSCAN算法 2865.6.3 OPTICS算法 2885.6.4 Weka实现 2915.7 CLOPE聚类 2965.7.1 稀疏数据 2965.7.2 CLOPE的基本思想 2975.7.3 算法描述 2985.7.4 算法实现细节 3015.7.5 Weka实现 3025.8 聚类方法辅助工具 3035.8.1 FilteredClusterer 3035.8.2 MakeDensityBasedClusterer 304第6章 基于频繁模式的关联规则 3056.1 模式挖掘的基本概念 3056.1.1 频繁模式 3056.1.2 频繁项集和关联规则 3066.1.3 闭频繁项集和极大频繁项集 3086.1.4 模式评估度量 3096.1.5 模式挖掘的分类 3206.2 Apriori算法 3226.2.1 算法思想及算法步骤 3226.2.2 算法效率提升策略 3276.2.3 典型模式提取 3296.2.4 基于频繁模式的分类器 3386.2.5 Weka实现 3426.3 FP-Growth算法 3456.3.1 算法思想 3456.3.2 算法步骤 3496.3.3 基于约束的剪枝 3506.3.4 Weka实现 3556.4 模式挖掘方法的辅助工具 356参考文献 358

封面

数据挖掘基础算法理论与Weka应用技术

书名:数据挖掘基础算法理论与Weka应用技术

作者:牟峰著

页数:12,360页

定价:¥188.0

出版社:科学出版社

出版日期:2019-11-01

ISBN:9787030628022

PDF电子书大小:52MB 高清扫描完整版

百度云下载:http://www.chendianrong.com/pdf

发表评论

邮箱地址不会被公开。 必填项已用*标注