CDA数据分析师系列丛书SPSS MODELER+WEKA数据挖掘从入门到实战

本书特色

[

内 容 简 介本书是一本面向商业数据挖掘建模分析人员的教材,从具体的商业数据分析案例入手,帮助读者掌握数据挖掘的目的、方法、工具与分析步骤。本书所采用的分析工具为目前颇受好评的IBM SPSS Modeler及开源软件Weka。IBM SPSS Modeler有很好的用户接口,也有不错的分析功能,但缺乏比较前沿的分析模块,以及很难与现有的信息系统结合,而Weka恰能弥补其缺憾。同时,这两个软件都不需要编程,适合初学者。本书具体内容由四位活跃在数据挖掘教学和项目开发一线的人员完成,内容侧重软件的实际操作。力图将复杂的技术以浅显的方式进行解释,尽量避免涉及过多的数学内容。

]

内容简介

[

内 容 简 介本书是一本面向商业数据挖掘建模分析人员的教材,从具体的商业数据分析案例入手,帮助读者掌握数据挖掘的目的、方法、工具与分析步骤。本书所采用的分析工具为目前颇受好评的IBM SPSS Modeler及开源软件Weka。IBM SPSS Modeler有很好的用户接口,也有不错的分析功能,但缺乏比较前沿的分析模块,以及很难与现有的信息系统结合,而Weka恰能弥补其缺憾。同时,这两个软件都不需要编程,适合初学者。本书具体内容由四位活跃在数据挖掘教学和项目开发一线的人员完成,内容侧重软件的实际操作。力图将复杂的技术以浅显的方式进行解释,尽量避免涉及过多的数学内容。

]

作者简介

[

铭传大学资讯工程学系教授兼系主任暨研究所所长铭传大学大数据研究中心主任中华资料采矿协会理事浙江大学城市学院客座教授云南财经大学信息学院客座教授厦门大学数据挖掘中心顾问中国人民大学数据挖掘中心顾问

]

目录

第1 篇 理论篇第1 章 数据挖掘简介 ……………………………………………………………………….. 11.1 数据挖掘的起源、定义及目标 …………………………………………………………………………… 21.2 数据挖掘的发展历程 …………………………………………………………………………………………. 21.3 SPSS Modeler 和Weka 基础操作 ………………………………………………………………………… 41.3.1 SPSS Modeler 软件简介 …………………………………………………………………………… 41.3.2 建立一个SPSS Modeler 项目 …………………………………………………………………… 51.3.3 Weka 软件环境简介 ………………………………………………………………………………… 81.3.4 Weka 简单操作实例 ………………………………………………………………………………… 9第2 章 数据挖掘方法论 …………………………………………………………………… 152.1 数据挖掘方法论 ………………………………………………………………………………………………. 162.1.1 CRISP-DM ……………………………………………………………………………………………. 162.1.2 SEMMA ……………………………………………………………………………………………….. 162.2 数据库中的知识挖掘步骤 ………………………………………………………………………………… 172.2.1 字段选择 ………………………………………………………………………………………………. 172.2.2 数据清洗 ………………………………………………………………………………………………. 182.2.3 字段扩充 ………………………………………………………………………………………………. 182.2.4 数据编码 ………………………………………………………………………………………………. 192.2.5 数据挖掘 ………………………………………………………………………………………………. 202.2.6 结果呈现 ………………………………………………………………………………………………. 212.3 案例:运用SPSS Modeler 和Weka 做客户的信用风险评分模型 ……………………….. 222.3.1 案例说明 ………………………………………………………………………………………………. 222.3.2 案例实操 ………………………………………………………………………………………………. 232.3.3 运用SPSS Modeler 进行初步的数据挖掘 ……………………………………………….. 282.3.4 运用Weka 进行数据汇入 ………………………………………………………………………. 342.3.5 Weka 自有数据存储格式arff 简介 …………………………………………………………. 36第3 章 基本的数据挖掘技术 ……………………………………………………………. 383.1 描述性统计 ……………………………………………………………………………………………………… 393.1.1 案例:通过数据判断客户是否需要新增电话线路 ………………………………….. 393.1.2 案例:运用描述性统计分析杂志社的客户特征 ……………………………………… 403.2 可视化技术 ……………………………………………………………………………………………………… 423.3 KNN 原理及实例 …………………………………………………………………………………………….. 443.3.1 KNN(K *近邻)算法 …………………………………………………………………………. 443.3.2 使用KNN 算法计算距离 ………………………………………………………………………. 453.3.3 案例:使用KNN 算法向用户推荐电影 ………………………………………………….. 493.4 案例:运用Weka 的KNN 算法对诊断结果进行预测 …………………………………………….. 523.4.1 案例说明 ………………………………………………………………………………………………. 523.4.2 运用Weka 中的IBk 模型进行预测 ………………………………………………………… 533.5 案例:运用SPSS Modeler 的KNN 算法预测客户是否接受人寿保险推销 …………. 583.5.1 案例说明 ………………………………………………………………………………………………. 583.5.2 案例实操 ………………………………………………………………………………………………. 59第4 章 数据挖掘进阶技术 ……………………………………………………………….. 684.1 数据挖掘的功能分类 ……………………………………………………………………………………….. 694.1.1 描述型数据挖掘(无监督数据挖掘) ……………………………………………………. 694.1.2 预测型数据挖掘(有监督数据挖掘) ……………………………………………………. 704.2 数据挖掘的绩效增益 ……………………………………………………………………………………….. 724.2.1 数据挖掘模型评估指标:正确率、响应率、查全率、F 值 …………………….. 724.2.2 数据挖掘模型评估指标:Gain Chart ………………………………………………………. 744.2.3 数据挖掘模型评估指标:Lift Chart ……………………………………………………….. 754.2.4 数据挖掘模型评估指标:Profit Chart …………………………………………………….. 764.3 数据挖掘网站 ………………………………………………………………………………………………….. 774.3.1 KDnuggets …………………………………………………………………………………………….. 774.3.2 Kaggle ………………………………………………………………………………………………….. 804.4 案例:评估新产品的促销活动效果 ………………………………………………………………….. 824.4.1 案例说明 ………………………………………………………………………………………………. 834.4.2 数据及字段描述 ……………………………………………………………………………………. 834.4.3 效能评估方式 ……………………………………………………………………………………….. 854.4.4 比赛结果排名 ……………………………………………………………………………………….. 85第2 篇 准备篇第5 章 数据预处理 …………………………………………………………………………. 875.1 字段选择 …………………………………………………………………………………………………………. 885.1.1 数据整合 ………………………………………………………………………………………………. 885.1.2 数据过滤 ………………………………………………………………………………………………. 885.1.3 案例:运用SPSS Modeler 过滤数据 ………………………………………………………. 895.2 数据清洗 …………………………………………………………………………………………………………. 925.2.1 错误值的检测及处理 …………………………………………………………………………….. 925.2.2 案例:运用SPSS Modeler 进行错误值的检测及处理 ……………………………… 925.2.3 离群值的检测及处理 …………………………………………………………………………….. 965

封面

CDA数据分析师系列丛书SPSS MODELER+WEKA数据挖掘从入门到实战

书名:CDA数据分析师系列丛书SPSS MODELER+WEKA数据挖掘从入门到实战

作者:经管之家

页数:284

定价:¥69.0

出版社:电子工业出版社

出版日期:2019-05-01

ISBN:9787121319112

PDF电子书大小:53MB 高清扫描完整版

百度云下载:http://www.chendianrong.com/pdf

发表评论

邮箱地址不会被公开。 必填项已用*标注