定 价:59 元
丛书名:普通高等教育智慧海洋技术系列教材
抱歉,本教材暂不参与当前样书赠送活动!
- 作者:王卓,秦洪德
- 出版时间:2024/12/1
- ISBN:9787030810670
- 出 版 社:科学出版社
适用读者:高等学校海洋机器人、智慧海洋技术等相关专业高年级本科生及研究生,从事相关专业研究的科技人员与高校师生
- 中图法分类:TP18,TP242.3
- 页码:170
- 纸张:
- 版次:1
- 开本:16
- 字数:264(单位:千字)
本书是一本融合人工智能及其在海洋机器人中应用的综合性教材,旨在为学生、研究人员和工程师提供全面的理论基础和实际应用技能。本书内容涵盖了人工智能的基础理论、人工神经网络在海洋机器人控制中的应用、强化学习方法在海洋机器人决策上的应用、基于深度学习的水下目标探测,以及人工智 能在海洋机器人中的具体应用实例。
更多科学出版社服务,请扫码获取。
研究生授课课程:
1潜器系统建模与仿真 硕士研究生
2计算机人工智能技术博士研究生人工智能和系统仿真2007年至今负责完成水下机器人和水面无人艇所有项目的计算机仿真实验验证,建立了水下机器人重点实验室的包括软硬件在内的仿真系统。2010年开始进行人工智能理论方法在水下机器人领域应用的研究,致力于研究水下机器人领域对人工智能提出的新要求、新问题。2014年至今组织团队成功申报了多项人工智能和水下机器人软件领域的科研项目。中国仿真学会机器人系统仿真专委会委员、中国造船工程学会女科学家工作委员会委员
目录
第一章 绪论 1
1.1 人工雛概述 1
1.2 人工智能的起源和发展史 1
1.3 图灵测试 3
1.4 弱人工智能与强人工智能 4
1.4.1 弱人工智能 4
1.4.2 强人工智能 4
1.4.3 弱人工智能与强人工智能的对比 5
1.5 人工智能的各个学派 6
1.5.1 符号主义 6
1.5.2 联结主义 6
1.5.3 为主义 7
1.6 海洋机器人概述 7
1.6.1 水面无人艇 8
1.6.2 水下机器人 12
1.6.3 海洋机器人的应用与挑战 15
第2章 知识表示 16
2.1 知识与知识表示的概念 16
2.1.1 知识的概念 16
2.1.2 知识的特性 17
2.1.3 知识的表示 18
2.2 状态空间法 18
2.2.1 问题状态描述 18
2.2.2 状态图示法 20
2.3 问题归约法 22
2.3.1 问题归约描述 22
2.3.2 与或酬述 24
2.4 P 生式表示法 27
2.4.1 P生式概述 27
2.4.2 f生式纖 29
2.4.3 产生式表示法的特点 30
2.5 面向对象的知识表示 31
2.5.1 关于对象的定义 31
2.5.2 消息、接口和方法 32
2.5.3 类 33
2.5.4 封装与继承 33
2.6 海洋机器人路径规划的知识表示 34
第3章 搜索策略 36
3.1 搜索概述 36
3.1.1 搜索的基本问题与主要过程 36
3.1.2 搜索策略分类 36
3.2 盲目搜索 37
3.2.1 宽度优先搜索 37
3.2.2 深度优先搜索 39
3.2.3 有界深度优先搜索 41
3.2.4 迭代廳搜索 42
3.3 启发式图搜索策略 42
3.3.1 启发式策略 43
3.3.2 启发信息和估价函数 45
3.3.3 A搜索算法 46
3.3.4 A*搜索算法及其特性分析 49
3.4 回溯策略 51
3.5 博弈搜索 53
3.5.1 极大极小过程 55
3.5.2 *过程 57
3.6 海洋机器人路径规划的启发式搜索 59
第4章 人工神经网络 61
4.1 神经信息处理基本原理 61
4.1.1 生物神经元结构 61
4.1.2 神经元数学模型 62
4.1.3 神经网络的结构与工作方式 63
4.1.4 神经网络的学习 63
4.2 感知器 64
4.2.1 人工神经元的基本构成 64
4.2.2 感知器的组成 65
4.3 BP神经网络 68
4.3.1 网络的构成 68
4.3.2 训练过程 69
4.3.3 误差传播分析 70
4.3.4 实例 72
4.4 RBF神经网络 74
4.4.1 径向基函数 74
4.4.2 径向基网络 75
4.4.3 RBF神经网络的设计和求解 76
4.4.4 实例 77
4.5 Hopfield神经网络 79
4.5.1 Hopfield神经网络的组织 79
4.5.2 稳定性分析 82
4.5.3 实例 85
4.6 自组织映射神经网络 86
4.6.1 典型结构 86
4.6.2 自组织学习过程 87
4.6.3 设计细 1? 88
4.6.4 实例 89
4.7 海洋机器人控制中的人工神经网络 90
4.7.1 基于RBF神经网络的监督控制 90
4.7.2 基于RBF神经网络的模型参考自适应控制 91
第5章 强化学习 93
5.1 强化学习概述 93
5.1.1 强化学习要素 93
5.1.2 强化学习过程 93
5.1.3 强化学习的分类 94
5.1.4 强化学习的局限与适用范围 94
5.2 马尔可夫决策 94
5.2.1 马尔可夫过程 95
5.2.2 马尔可夫奖励过程 96
5.2.3 马尔可夫决策过程 98
5.3 动态細胜 101
5.3.1 策略评估 102
5.3.2 策略改进 106
5.3.3 策略迭代与价值迭代 107
5.3.4 异步动态规划 108
5.4 蒙特卡罗法 109
5.4.1 蒙特卡罗概率统计 109
5.4.2 “经验”与“平均” 111
5.4.3 蒙特卡罗控制 112
5.4.4 非探索性初始化假设的蒙特卡罗控制 113
5.5 时间差分法 116
5.5.1 时间差分法的值函数 117
5.5.2 时间差分法的优点 117
5.5.3 时间差分控制 118
5.6 策略梯度 124
5.7 海洋机器人中的强化学习 126
第6章 深度学习 131
6.1 深度前馈网络 131
6.2 基于梯度的学习 132
6.2.1 代价函数 132
6.2.2 使用最大似然学习条件分布 133
6.2.3 输出单元 133
6.3 正则化 137
6.3.1 参数范数惩罚 137
6.3.2 L2参数正则化 138
6.3.3 L1参数正则化 140
6.3.4 作为约束的范数惩罚 141
6.3.5 正则化和欠约束问题 143
6.3.6 数据集增强 143
6.3.7 噪声鲁棒性 144
6.3.8 半监督学习 145
6.3.9 提前终止 145
6.3.10 Bagging方法 147
6.3.11 Dropout方法 148
6.4 卷积网络 154
6.4.1 卷积运算的定义 155
6.4.2 卷积神经网络中的卷积运算 155
6.4.3 卷积神经网络的特点 156
6.4.4 卷积神经网络层 157
6.4.5 多层卷积 161
6.4.6 AlexNet(实例) 162
6.5 基于深度学习的目标探测框架 166
6.5.1 YOLO框架 166
6.5.2 Transformer框架 167
6.5.3 R-CNN算法 168
参考文献 169