用商业案例学R语言数据挖掘

本书特色

[

商业智能时代已经全面到来,分析型人才的岗位数量在就业市场中呈现井喷式增长。无论是从事产品研发的工程师,还是从事产品推广的市场人员、人力资源和财务会计人员,都需要掌握数据分析技术,否则很有可能被人工智能替代。
本书包括 18 章,涉及使用 R 语言做数据分析和数据挖掘的主要分析方法。其中,第 1、 2 章为数据分析方法概述,第 3 章为 R 语言编程基础,第 4 章到第 8 章为统计学习方法,第 9 章到第 16 章为数据挖掘方法,第 17 章为特征工程,第 18 章为 R 文本挖掘。每章都根据所涉及的知识点的不同,选取了实用的案例,并为读者准备了相应的练习题。
本书作为 CDA 数据分析师系列丛书中《如虎添翼!数据处理的 SPSS 和 SAS EG 实现(第 2 版)》和《胸有成竹!数据分析的 SPSS 和 SAS EG 进阶(第 2 版)》的姊妹篇,将前两本书的内容进行整合并做了重大拓展,而且秉承了该系列丛书的特点:内容精练、重点突出、示例丰富、语言通俗。可以作为广大从业人员自学商业数据分析的读物,适合大中专院校师生学习和阅读,同时也可以作为高等院校商科、社会科学及相关培训机构的教材。

]

内容简介

[

本书适合人群:
本书是一本面向商业数据分析初学者的教材,从具体的商业数据分析案例入手,使读者掌握数据挖掘的目的、理念、思路与分析步骤。本书力图淡化技术,对于方法的介绍也尽量避免涉及过多的数学内容,和高等数学相关的内容只在线形回归和主成分分析这两节中涉及,而且都辅以图形做形象的展现。因此本书的读者只需要具有高中水平的数学基础即可。但是本书强调每种方法的假设、适用条件都与商业数据分析的主题匹配。在教学实践中,我们发现业务经验丰富和有较好商业模式理解的学员,在学习数据挖掘时有更好的效果,主要原因可能是这类学员有较强的思辨能力、分析能力、学习目的性和质量意识,而不是简单地模仿和套用数学公式。

]

作者简介

[

常国珍,北京大学会计学博士,中国大数据产业生态联盟专家委员会专家委员。主要从事金融、电信行业客户画像,信用与操作风险识别与防范,客户终生价值预测与价值提升等工作。
曾珂,华中师范大学管理科学工程硕士,现为第一车贷金融产品部产品经理,精通Python与R语言数据挖掘。曾经就职于华为、国家电网等企业。以金融信用与欺诈风险建模、文本分析、数据可视化等为主要研究方向。
朱江,挪威科技大学工学硕士,现为CDA数据分析研究院课程开发副总监,CDA数据挖掘竞赛的评委。精通R与SAS语言数据挖掘,从事电商与互联网数据分析的教学工作。研究方向为电商推荐系统开发、数据可视化、客户特征提取和客户行为模式发现。

]

目录

第1章商业数据分析基础1.1 商业数据分析的本质1.2 商业数据分析中心的建设 第 2 章 数据分析的武器库2.1 数据挖掘简介2.2 R 语言简介2.3 R 与 RStudio 的下载和安装2.4 在 RStudio 中安装包2.5 练习题 第 3 章 R 语言编程3.1 R 的基本数据类型3.2 R 的基本数据结构 3.3 R 的程序控制3.4 R 的函数 3.5 R 的日期与时间数据类型 3.6 在 R 中读写数据3.7 练习题第 4 章 R 描述性统计分析与绘图4.1 描述性统计分析4.2 制图的步骤4.3 R 基础绘图包 4.4 ggplot2 绘图4.5 练习题第 5 章 数据整合和数据清洗5.1 数据整合5.2 R 中的高级数据整合5.3 R 中的抽样5.4 R 的数据清洗 . 5.5 数据整合第 6 章 统计推断基础 6.1 基本的统计学概念 6.3 双样本 t 检验 6.4 方差分析(分类变量和连续变量关系检验)6.5 相关分析(两连续变量关系检验)6.6 卡方检验(两分类变量关系检验)6.7 练习题. 第 7 章 客户价值预测:线性回归模型与诊断 7.1 相关性分析7.2 线性回归7.3 线性回归诊断 7.4 正则化方法7.5 练习题 第 8 章 Logistic 回归构建初始信用评级8.1 Logistic 回归的相关关系分析8.2 Logistic 回归模型及实现8.3 *大熵模型与极大似然法估计8.4 模型评估8.5 练习题第 9 章 使用决策树进行信用评级 9.1 决策树建模思路9.2 决策树算法9.3 在 R 中实现决策树9.4 组合算法(Ensemble Learning)9.5 练习题第 10 章 神经网络10.1 神经元模型10.2 人工神经网络模型10.3 单层感知器10.4 BP 神经网络10.5 RBF 神经网络10.6 神经网络设计与 R 代码实现10.7 练习题第 11 章 分类器入门:*近邻域与贝叶斯网络. 11.1 分类器的概念 11.2 KNN 算法11.3 朴素贝叶斯11.4 贝叶斯网络11.5 练习题 第 12 章 高级分类器:支持向量机12.1 线性可分与线性不可分 12.2 线性可分支持向量机12.3 线性支持向量机12.4 非线性支持向量机12.5 R 中的支持向量机12.6 练习题第 13 章 连续变量的维度归约13.1 维度归约方法概述13.2 主成分分析13.3 因子分析13.4 奇异值分解13.5 对应分析和多维尺度分析13.6 练习题第 14 章 聚类14.1 聚类分析概述14.2 聚类算法逻辑. 14.3 层次聚类. 14.4 k-means 聚类14.5 基于密度的聚类. 14.6 聚类模型的评估14.7 高斯混合模型(Gaussian Mixture Model)14.8 客户分群14.9 练习题第 15 章 关联规则与推荐算法15.1 长尾理论15.2 关联规则 15.3 序贯模型15.4 推荐算法与推荐系统. 15.5 练习题. 第 16 章 时间序列建模 16.1 认识时间序列16.2 简单时间序列分析. 16.3 平稳时间序列分析 ARMA 模型16.4 非平稳时间序列分析 ARIMA 模型第 17 章 特征工程( Feature Engineering)(博文视点官方网站下载) 17.1 特征工程概述. 17.2 数据预处理(Data Preprocessing)17.3 特征构造(Feature Construction)17.4 特征抽取(Feature Extraction)17.5 特征选择(Feature Selection)第 18 章 R 文本挖掘(博文视点官方网站下载)18.1 文本挖掘18.2 文本清洗18.3 中文分词与文档模型. 18.4 文本的特征选择及相关性度量 18.5 文本分类18.6 主题模型18.7 综合案例. 附录 A 数据说明(博文视点官方网站下载)

封面

用商业案例学R语言数据挖掘

书名:用商业案例学R语言数据挖掘

作者:常国珍

页数:445

定价:¥69.0

出版社:电子工业出版社

出版日期:2017-09-01

ISBN:9787121319587

PDF电子书大小:124MB 高清扫描完整版

百度云下载:http://www.chendianrong.com/pdf

发表评论

邮箱地址不会被公开。 必填项已用*标注