Anaconda数据科学实战

本书特色

[

Anaconda是一个强大的开源数据科学平台,它将很多好的工具整合在一起,极大地简化了使用者的工作流程,并能够帮助使用者解决一系列数据科学难题。 《Anaconda数据科学实战》旨在通过一系列示例,引导读者在编码和图表中了解Anaconda的强大之处。本书包括12章,结合R、Python、Octave和Julia等4种编程语言,从平台的安装和配置开始,循序渐进地引导读者掌握数据集的获取、数据可视化、统计建模、管理包、Anaconda的优化、无监督学习、监督学习、数据预测分析、云、分布式计算等内容。 本书示例丰富,讲解细致,作者不仅在金融领域有着深厚的积累,还有着丰富的教学经验。对于那些有兴趣了解金融领域数据科学的读者,以及普通的数据分析师或数据科学从业者,本书都是一个不错的选择。在阅读本书之前,我们希望读者具备R或Python的基本编程知识,以及线性代数相关的基本知识。

]

内容简介

[

本书讲解的是如何使用该工具在真实的环境中执行数据科学任务。本书涵盖了Anaconda的基础知识 (下载、安装、配置) , 使用Conda进行包管理的方法, 以及使用各种包进行数据分析的知识 (数据整理、归类、建模、可视化等) 。

]

作者简介

[

严玉星博士毕业于麦吉尔大学,获得金融学博士学位。他曾在加拿大、新加坡和美国的8 所大学教授各种金融课程,发表23篇研究和教学相关的论文,并著有6本书。此外,他还精通R、Python、SAS、MATLAB、Octave 和C 语言,是金融数据分析方面的专家。 詹姆斯·严当前在多伦多大学攻读计算机科学和统计学双学位。他还精通Python、R、Java、MATLAB 和SQL等。

]

目录

第 1章 Anaconda生态系统 11.1 简介 11.1.1 通过Anaconda使用Jupyter的理由 21.1.2 在无须预装的情况下使用Jupyter 21.2 Miniconda 51.3 Anaconda云 51.4 查找帮助 61.5 总结 81.6 问题回顾及练习 9第 2章 Anaconda安装 112.1 安装Anaconda 112.2 测试Python 132.3 使用IPython 142.4 通过Jupyter使用Python 162.5 Spyder简介 172.6 通过Conda安装R 192.7 安装Julia并链接到Jupyter 202.8 安装Octave并链接到Jupyter 212.9 查找帮助 232.10 总结 252.11 问题回顾及练习 25第3章 数据基础 273.1 数据源 283.2 UCI机器学习 283.3 Python包pandas简介 313.4 输入数据的几种方式 323.4.1 使用R输入数据 333.4.2 使用Python输入数据 343.5 Quandl数据分发平台简介 363.6 处理缺失数据 393.7 数据排序 423.7.1 切割数据集 453.7.2 合并不同数据集 453.7.3 数据输出 483.8 Python包cbsodata简介 493.9 Python包datadotworld简介 503.10 R包haven和foreign简介 513.11 R包dslabs简介 523.12 生成Python数据集 533.13 生成R数据集 553.14 总结 563.15 问题回顾及练习 56第4章 数据可视化 594.1 数据可视化的重要性 594.2 R数据可视化 604.3 Python数据可视化 664.4 Julia数据可视化 694.5 绘制简单图形 714.5.1 各种条状图、饼图和直方图 744.5.2 添加趋势 754.5.3 添加图解和其他说明 764.6 R可视化包 794.7 Python可视化包 814.8 Julia可视化包 824.9 动态可视化 834.9.1 将图片存储为pdf 864.9.2 将动态可视化存储为HTML文件 864.10 总结 874.11 问题回顾及练习 87第5章 在Anaconda中统计建模 905.1 线性模型简介 915.2 在R、Python、Julia和Octave中运行线性回归 925.3 临界值和决策规则 965.4 F检验、临界值和决策规则 975.5 处理缺失数据 1045.5.1 清除缺失数据 1045.5.2 用其他值替换缺失数据 1055.6 检测及处理异常值 1065.7 几个多元线性模型 1085.8 共线性及其解决方案 1115.9 一个模型的性能测量 1135.10 总结 1135.11 问题回顾及练习 113第6章 管理包 1176.1 包、模块和工具箱简介 1186.2 使用包的两个示例 1186.3 查找所有R包 1236.4 查找所有Python包 1246.5 查找所有Julia包 1256.6 查找所有Octave包 1266.7 R中的任务视图 1266.8 查找手册 1286.9 包依赖 1296.10 R包管理 1306.11 Python包管理 1326.12 Julia包管理 1336.13 Octave包管理 1346.14 包管理器conda 1356.15 在R和Python中创建程序集 1376.16 查找环境变量 1386.17 总结 1406.18 问题回顾及练习 140第7章 Anaconda的优化 1427.1 为何优化很重要 1427.2 优化的一般问题 1447.3 二次优化 1487.3.1 R中的优化 1497.3.2 Python中的优化 1517.3.3 Julia中的优化 1537.3.4 Octave中的优化 1567.4 股票投资组合优化 1597.5 *优的税收政策 1617.6 R中用于优化的包 1627.7 Python中用于优化的包 1647.8 Octave中用于优化的包 1657.9 Julia中用于优化的包 1657.10 总结 1667.11 问题回顾及练习 166第8章 Anaconda中的无监督学习 1688.1 无监督学习简介 1698.2 层次聚类 1738.3 k-均值聚类 1778.4 Python包scipy简介 1798.5 Python包contrastive简介 1818.6 Python包sklearn(scikit-learn)简介 1818.7 R包rattle简介 1858.8 R包randomUniformForest简介 1878.9 R包Rmixmod简介 1898.10 Julia实现 1908.11 聚类分析的任务视图 1918.12 总结 1928.13 问题回顾及练习 192第9章 Anaconda中的监督学习 1949.1 监督学习概览 1949.2 分类 1999.2.1 k-*近邻算法 2009.2.2 贝叶斯分类器 2029.2.3 强化学习 2049.3 监督学习的R实现 2059.4 Python实现 2099.5 Octave实现 2139.6 Julia实现 2179.7 总结 2199.8 问题回顾及练习 220第 10章 数据预测分析:建模和验证 22310.1 理解数据预测分析 22310.2 有用的数据集 22410.2.1 R包AppliedPredictiveModeling 22610.2.2 时间序列分析 22810.3 预测未来事件 22910.3.1 季节性 23210.3.2 可视化组件 23310.3.3 R包LiblineaR 23410.3.4 R包datarobot 23610.3.5 R包eclust 23610.4 模型选择 23810.4.1 Python包model-catwalk 24010.4.2 Python包sklearn 24010.4.3 Julia包QuantEcon 24210.4.4 Octave包ltfat 24310.5 Granger因果关系检验 24510.6 总结 24710.7 问题回顾及练习 247第 11章 Anaconda云 25011.1 Anaconda云简介 25011.2 深入学习Jupyter Notebook 25111.2.1 Jupyter Notebook格式 25411.2.2 Notebooks分享 25611.2.3 项目分享 25811.2.4 环境分享 26011.3 复制他人的环境到本地 26111.4 总结 26511.5 问题回顾及练习 265第 12章 分布式计算、并行计算和HPCC 26712.1 分布式和并行计算简介 26712.1.1 并行处理的任务视图 26812.1.2 Python示例程序 26912.2 理解MPI 27012.2.1 R包Rmpi 27012.2.2 R包plyr 27112.2.3 R包parallel 27212.2.4 R包snow 27612.3 Python并行处理 27612.3.1 单词频率的并行处理 27812.3.2 Monte-Carlo期权定价并行处理 27812.4 计算节点 28012.5 Anaconda附加组件 28012.6 HPCC简介 28112.7 总结 28312.8 问题回顾及练习 283

封面

Anaconda数据科学实战

书名:Anaconda数据科学实战

作者:(美)严玉星,(美)詹姆斯·严(Jame

页数:284页

定价:¥79.0

出版社:人民邮电出版社

出版日期:2020-05-01

ISBN:9787115534507

PDF电子书大小:146MB 高清扫描完整版

百度云下载:http://www.chendianrong.com/pdf

发表评论

邮箱地址不会被公开。 必填项已用*标注