视觉SLAM十四讲:从理论到实践

本书特色

[

本书系统介绍了视觉SLAM(同时定位与地图构建)所需的基本知识与核心算法,既包括数学理论基础,如三维空间的刚体运动、非线性优化,又包括计算机视觉的算法实现,例如多视图几何、回环检测等。此外,还提供了大量的实例代码供读者学习研究,从而更深入地掌握这些内容。本书可以作为对SLAM 感兴趣的研究人员的入门自学材料,也可以作为SLAM 相关的高校本科生或研究生课程教材使用。

]

内容简介

[

适读人群:本书适合对SLAM感兴趣的读者阅读,也适合有志于从事计算机视觉、机器人研究等领域的广大学生阅读,可作为SLAM技术的入门教材。
SLAM技术是全自动无人驾驶、无人机、机器人等人工智能产品的核心技术之一。
作者是SLAM领域非常杰出的青年专家。
书中不仅有深入浅出的讲解,同时注重理论和实践结合,大大降低了国内学生和相关从业者的进入门槛。

]

作者简介

[

  高翔,2008年就读清华大学自动化系,2012年免试进入清华大学自动化系攻读博士学位。研究课题为视觉SLAM,兴趣包括计算机视觉与机器学习。曾撰写过与SLAM相关的论文和技术博客。
张涛,清华大学自动化系教授、党委书记、副系主任。1995年9月至1999年9月在清华大学自动化系检测技术与自动化装置专业学习,获博士学位。1999年10月至2002年9月在日本国立佐贺大学大学院工学系研究科系统控制专业学习,获博士学位。研究课题包括机器人、航空航天、计算机视觉等。
  刘毅,华中科技大学图像与人工智能研究所在读博士,本科毕业于武汉理工大学数学系。读博期间专注于图像处理、三维重建、视觉SLAM,以及传感器融合研究和应用,读博期间先后于深圳市大疆创新公司,英特尔中国研究院等单位实习。
颜沁睿,比利时荷语鲁汶大学人工智能硕士,电子工程学士(GroupT)。电子科技大学信息显示与光电技术学士。长期致力于研究人工智能技术在机器人领域的应用,包括计算机视觉、机器学习和SLAM。现担任地平线机器人公司智能驾驶部算法工程师。

]

目录

第1 讲预备知识 11.1 本书讲什么11.2 如何使用本书31.2.1 组织方式31.2.2 代码51.2.3 面向的读者61.3 风格约定61.4 致谢和声明7第2 讲初识SLAM 92.1 引子:小萝卜的例子112.2 经典视觉SLAM 框架172.2.1 视觉里程计172.2.2 后端优化192.2.3 回环检测202.2.4 建图212.3 SLAM 问题的数学表述222.4 实践:编程基础 252.4.1 安装Linux 操作系统252.4.2 Hello SLAM272.4.3 使用cmake282.4.4 使用库302.4.5 使用IDE32第3 讲三维空间刚体运动373.1 旋转矩阵393.1.1 点和向量,坐标系393.1.2 坐标系间的欧氏变换403.1.3 变换矩阵与齐次坐标423.2 实践:Eigen 443.3 旋转向量和欧拉角483.3.1 旋转向量483.3.2 欧拉角503.4 四元数513.4.1 四元数的定义513.4.2 四元数的运算533.4.3 用四元数表示旋转553.4.4 四元数到旋转矩阵的转换553.5 * 相似、仿射、射影变换563.6 实践:Eigen 几何模块573.7 可视化演示60第4 讲李群与李代数624.1 李群与李代数基础 644.1.1 群644.1.2 李代数的引出654.1.3 李代数的定义 674.1.4 李代数so(3) 674.1.5 李代数se(3)684.2 指数与对数映射694.2.1 SO(3) 上的指数映射694.2.2 SE(3) 上的指数映射.704.3 李代数求导与扰动模型724.3.1 BCH 公式与近似形式724.3.2 SO(3) 李代数上的求导734.3.3 李代数求导744.3.4 扰动模型(左乘)754.3.5 SE(3) 上的李代数求导764.4 实践:Sophus764.5 * 相似变换群与李代数.794.6 小结81第5 讲相机与图像825.1 相机模型 845.1.1 针孔相机模型845.1.2 畸变875.1.3 双目相机模型 905.1.4 RGB-D 相机模型925.2 图像935.3 实践:图像的存取与访问955.3.1 安装OpenCV955.3.2 操作OpenCV 图像965.4 实践:拼接点云99第6 讲非线性优化1046.1 状态估计问题1066.1.1 *大后验与*大似然1066.1.2 *小二乘的引出 1086.2 非线性*小二乘1096.2.1 一阶和二阶梯度法1106.2.2 高斯牛顿法1116.2.3 列文伯格—马夸尔特方法1136.2.4 小结1146.3 实践:Ceres1156.3.1 Ceres 简介 1166.3.2 安装Ceres1166.3.3 使用Ceres 拟合曲线 1176.4 实践:g2o1216.4.1 图优化理论简介1216.4.2 g2o 的编译与安装1226.4.3 使用g2o 拟合曲线1236.5 小结128第7 讲视觉里程计11307.1 特征点法1327.1.1 特征点1327.1.2 ORB 特征1347.1.3 特征匹配1377.2 实践:特征提取和匹配1387.3 2D?2D: 对极几何1417.3.1 对极约束1417.3.2 本质矩阵1437.3.3 单应矩阵1467.4 实践:对极约束求解相机运动1487.5 三角测量1537.6 实践:三角测量1547.6.1 三角测量代码1547.6.2 讨论1567.7 3D?2D:PnP1577.7.1 直接线性变换1587.7.2 P3P1597.7.3 Bundle Adjustment 1617.8 实践:求解PnP1657.8.1 使用EPnP 求解位姿1657.8.2 使用BA 优化1667.9 3D?3D:ICP1727.9.1 SVD 方法1737.9.2 非线性优化方法 1757.10 实践:求解ICP1767.10.1 SVD 方法1767.10.2 非线性优化方法1787.11 小结180第8 讲视觉里程计21828.1 直接法的引出1848.2 光流(Optical Flow)1858.3 实践:LK 光流1878.3.1 使用TUM 公开数据集1878.3.2 使用LK 光流1888.4 直接法(Direct Method)1928.4.1 直接法的推导 1928.4.2 直接法的讨论1958.5 实践:RGB-D 的直接法1968.5.1 稀疏直接法1968.5.2 定义直接法的边1978.5.3 使用直接法估计相机运动 1998.5.4 半稠密直接法2008.5.5 直接法的讨论 2028.5.6 直接法优缺点总结 203第9 讲实践:设计前端2059.1 搭建VO 框架 2069.1.1 确定程序框架2079.1.2 确定基本数据结构2089.1.3 Camera 类2109.1.4 Frame 类2129.1.5 MapPoint 类 2139.1.6 Map 类 2139.1.7 Config 类 2149.2 基本的VO:特征提取和匹配2169.2.1 两两帧的视觉里程计2169.2.2 讨论2249.3 改进:优化PnP 的结果 2249.4 改进:局部地图 2279.5 小结233第10 讲后端1 23510.1 概述23710.1.1 状态估计的概率解释23710.1.2 线性系统和KF23910.1.3 非线性系统和EKF24210.1.4 EKF 的讨论24310.2 BA 与图优化24510.2.1 投影模型和BA 代价函数 24510.2.2 BA 的求解24710.2.3 稀疏性和边缘化24810.2.4 鲁棒核函数25510.2.5 小结25610.3 实践:g2o25710.3.1 BA 数据集25710.3.2 g2o 求解BA25810.3.3 求解26210.4 实践:Ceres 26410.4.1 Ceres 求解BA 26510.4.2 求解26710.5 小结269第11 讲后端2 27011.1 位姿图(Pose Graph)27111.1.1 Pose Graph 的意义27111.1.2 Pose Graph 的优化27211.2 实践:位姿图优化27411.2.1 g2o 原生位姿图 27411.2.2 李代数上的位姿图优化27811.2.3 小结28411.3 * 因子图优化初步28511.3.1 贝叶斯网络28511.3.2 因子图28611.3.3 增量特性28811.4 * 实践:gtsam 28911.4.1 安装gtsam 4.028911.4.2 位姿图优化290第12 讲回环检测29712.1 回环检测概述29912.1.1 回环检测的意义29912.1.2 方法 30012.1.3 准确率和召回率30112.2 词袋模型30312.3 字典 30512.3.1 字典的结构30512.3.2 实践:创建字典30612.4 相似度计算30912.4.1 理论部分30912.4.2 实践:相似度的计算31012.5 实验分析与评述31412.5.1 增加字典规模31412.5.2 相似性评分的处理31612.5.3 关键帧的处理31612.5.4 检测之后的验证31712.5.5 与机器学习的关系317第13 讲建图31913.1 概述32013.2 单目稠密重建32213.2.1 立体视觉32213.2.2 极线搜索与块匹配32313.2.3 高斯分布的深度滤波器32513.3 实践:单目稠密重建32813.4 实验分析与讨论33913.4.1 像素梯度的问题33913.4.2 逆深度34013.4.3 图像间的变换 34113.4.4 并行化:效率的问题34213.4.5 其他的改进34313.5 RGB-D 稠密建图34313.5.1 实践:点云地图34413.5.2 八叉树地图34713.5.3 实践:八叉树地图35013.6 *TSDF 地图和Fusion 系列35213.7 小结356第14 讲SLAM:现在与未来35714.1 当前的开源方案35814.1.1 MonoSLAM35814.1.2 PTAM35914.1.3 ORB-SLAM36114.1.4 LSD-SLAM36314.1.5 SVO 36414.1.6 RTAB-MAP36614.1.7 其他36714.2 未来的SLAM 话题36714.2.1 视觉 惯性导航SLAM36714.2.2 语义SLAM36914.2.3 SLAM 的未来 370附录A 高斯分布的性质371A.1 高斯分布371A.2 高斯分布的运算371A.2.1 线性运算371A.2.2 乘积372A.2.3 复合运算372A.3 复合的例子372附录B ROS 入门374B.1 ROS 是什么374B.2 ROS 的特点375B.3 如何快速上手ROS375参考文献377

封面

视觉SLAM十四讲:从理论到实践

书名:视觉SLAM十四讲:从理论到实践

作者:高翔等

页数:388

定价:¥75.0

出版社:电子工业出版社

出版日期:2017-03-01

ISBN:9787121311048

PDF电子书大小:62MB 高清扫描完整版

百度云下载:http://www.chendianrong.com/pdf

发表评论

邮箱地址不会被公开。 必填项已用*标注