数据科学导论-Python语言实现

本书特色

[

本书首先介绍如何设置基本的数据科学工具箱,然后带你进入数据改写和预处理阶段,这一部分主要是阐明所有与核心数据科学活动相关的数据分析过程,如数据加载、转换、修复以及数据探索和处理等。*后,通过主要的机器学习算法、图形分析技术,以及所有易于表现结果的可视化工具,实现对数据科学的概述。

]

目录

译者序前言第1章 新手上路11.1 数据科学与python简介11.2 python的安装21.2.1 python 2还是python 331.2.2 分步安装31.2.3 python核心工具包一瞥41.2.4 工具包的安装71.2.5 工具包升级91.3 科学计算发行版91.3.1 anaconda101.3.2 enthought canopy101.3.3 pythonxy101.3.4 winpython101.4 ipython简介101.4.1 ipython notebook121.4.2 本书使用的数据集和代码181.5 小结25第2章 数据改写262.1 数据科学过程262.2 使用pandas进行数据加载与预处理272.2.1 数据快捷加载272.2.2 处理问题数据302.2.3 处理大数据集322.2.4 访问其他数据格式362.2.5 数据预处理372.2.6 数据选择392.3 使用分类数据和文本数据412.4 使用numpy进行数据处理492.4.1 numpy中的n维数组492.4.2 numpy ndarray对象基础502.5 创建numpy数组502.5.1 从列表到一维数组502.5.2 控制内存大小512.5.3 异构列表522.5.4 从列表到多维数组532.5.5 改变数组大小542.5.6 利用numpy函数生成数组562.5.7 直接从文件中获得数组572.5.8 从pandas提取数据572.6 numpy快速操作和计算582.6.1 矩阵运算602.6.2 numpy数组切片和索引612.6.3 numpy数组堆叠632.7 小结65第3章 数据科学流程663.1 eda简介663.2 特征创建703.3 维数约简723.3.1 协方差矩阵723.3.2 主成分分析733.3.3 一种用于大数据的pca变型—randomized pca763.3.4 潜在因素分析773.3.5 线性判别分析773.3.6 潜在语义分析783.3.7 独立成分分析783.3.8 核主成分分析783.3.9 受限玻耳兹曼机803.4 异常检测和处理813.4.1 单变量异常检测823.4.2 ellipticenvelope833.4.3 oneclasssvm873.5 评分函数903.5.1 多标号分类903.5.2 二值分类923.5.3 回归933.6 测试和验证933.7 交叉验证973.7.1 使用交叉验证迭代器993.7.2 采样和自举方法1003.8 超参数优化1023.8.1 建立自定义评分函数1043.8.2 减少网格搜索时间1063.9 特征选择1083.9.1 单变量选择1083.9.2 递归消除1103.9.3 稳定性选择与基于l1的选择1113.10 小结112第4章 机器学习1134.1 线性和逻辑回归1134.2 朴素贝叶斯1164.3 k近邻1184.4 高级非线性算法1194.4.1 基于svm的分类算法1204.4.2 基于svm的回归算法1224.4.3 调整svm1234.5 组合策略1244.5.1 基于随机样本的粘合策略1254.5.2 基于弱组合的分袋策略1254.5.3 随机子空间和随机分片1264.5.4 模型序列—adaboost1274.5.5 梯度树提升1284.5.6 处理大数据1294.6 自然语言处理一瞥1364.6.1 词语分词1364.6.2 词干提取1374.6.3 词性标注1374.6.4 命名实体识别1384.6.5 停止词1394.6.6 一个完整的数据科学示例—文本分类1404.7 无监督学习概述1414.8 小结146第5章 社会网络分析1475.1 图论简介1475.2 图的算法1525.3 图的加载、输出和采样1575.4 小结160第6章 可视化1616.1 matplotlib基础介绍1616.1.1 曲线绘图1626.1.2 绘制分块图1636.1.3 散点图1646.1.4 直方图1656.1.5 柱状图1666.1.6 图像可视化1676.2 pandas的几个图形示例1696.2.1 箱线图与直方图1706.2.2 散点图1716.2.3 平行坐标1736.3 高级数据学习表示1746.3.1 学习曲线1746.3.2 验证曲线1766.3.3 特征重要性1776.3.4 gbt部分依赖关系图1796.4 小结180

封面

数据科学导论-Python语言实现

书名:数据科学导论-Python语言实现

作者:博斯凯蒂

页数:180

定价:¥49.0

出版社:机械工业出版社

出版日期:2016-08-01

ISBN:9787111544340

PDF电子书大小:140MB 高清扫描完整版

百度云下载:http://www.chendianrong.com/pdf

发表评论

邮箱地址不会被公开。 必填项已用*标注