定 价:52 元
丛书名:
抱歉,电子工业出版社不参与样书赠送活动!
- 作者:孙勇
- 出版时间:2025/6/1
- ISBN:9787121503689
- 出 版 社:电子工业出版社
适用读者:本书兼容学校教学与产业应用需求,既为高校新工科教学提供了系统性课程载体,也为企业的智能化转型提供了技术实施路径,助力开发者掌握生成式人工智能的关键技术范式与创新应用思维。
- 中图法分类:TP18
- 页码:176
- 纸张:
- 版次:01
- 开本:16开
- 字数:282(单位:千字)
本书是一本关于生成式人工智能技术的通识性教材,围绕技术探索、伦理治理与行业实践三大维度构建了多层次的知识体系。全书分为理论基础、核心技术与产业应用三大模块,深入解析了大模型生成机制、多模态协同、RAG技术及人工智能伦理等核心领域。通过医疗诊断、工业质检等典型场景案例,结合可复现的Jupyter Notebook代码,实现了从技术原理到工程实践的学习闭环。本书以“技术深度+实践广度”为特色,拆解了提示工程、跨媒体生成等关键技术流程,从VAE模型开发到LangChain智能体部署,完整覆盖了生成式人工智能的技术链教学。同时,同步探讨了数据偏见治理、算法透明性等伦理命题,并介绍了主流的人工智能伦理评估框架。通过金融、教育、制造等八大行业场景的解析,建立了领域需求与技术应用的双向连接,完整展现了生成式人工智能的产业化落地方向。本书兼容学校教学与产业应用需求,既为高校新工科教学提供了系统性课程载体,也为企业的智能化转型提供了技术实施路径,助力开发者掌握生成式人工智能的关键技术范式与创新应用思维。
孙勇,教授,浙江交通职业技术学院智慧交通学院专业带头人,杭州市人工智能学会理事,研究方向为:人工智能、大数据技术。出版教材多部。
第1章 生成式人工智能简介 1
1.1 从图灵测试说起 2
1.1.1 图灵测试的基本原理与影响 2
1.1.2 图灵测试的执行与挑战 3
1.1.3 智能的度量方法 3
1.1.4 人工智能与人类智能之间的关系 4
1.2 从数据到知识 4
1.2.1 DIKW模型 5
1.2.2 知识的表示 6
1.2.3 自然语言处理的发展史 7
1.3 通用人工智能的曙光 9
1.3.1 内容皆可生成 9
1.3.2 文本生成 10
1.3.3 图片生成 11
1.3.4 视频生成 12
1.3.5 决策式AI与生成式AI 14
1.4 实验1:分辨人类创作与AIGC 15
1.4.1 实验目的 15
1.4.2 实验步骤 15
第2章 预训练大模型 16
2.1 什么是GPT 16
2.1.1 Generative(生成式) 17
2.1.2 Pre-trained(预训练) 18
2.1.3 Transformer(变换器) 19
2.2 大模型的关键技术 20
2.2.1 基于人类反馈的强化学习 20
2.2.2 模型微调 21
2.2.3 基于提示词的自然交互 22
2.3 大模型的能力评估 23
2.3.1 评估基准指标 23
2.3.2 国内外主流大模型能力评估 24
2.4 规模定律 25
2.4.1 机器是如何学习的 25
2.4.2 规模定律的性质与应用 27
2.4.3 模型性能的涌现 28
2.5 实验2:写作比赛 29
2.5.1 实验目的 29
2.5.2 实验步骤 29
第3章 负责任的生成式人工智能 30
3.1 什么是AI伦理 31
3.1.1 AI伦理与科技 31
3.1.2 AI伦理与道德 32
3.1.3 我国AI伦理发展现状 32
3.2 AIGC引发的风险与挑战 33
3.2.1 数据隐私和安全性 33
3.2.2 内容的真实性和准确性 35
3.2.3 歧视与偏见 37
3.2.4 对法律法规的挑战 37
3.3 构建负责任的AIGC的原则与策略 38
3.3.1 构建原则 39
3.3.2 构建策略 42
3.4 实验3:使用平台快速搭建自己的AIGC应用 44
3.4.1 实验目的 44
3.4.2 实验步骤 44
3.4.3 实验总结与评估 45
第4章 提示工程 46
4.1 提示词 47
4.1.1 什么是token 47
4.1.2 如何设计提示词 49
4.2 思维链 54
4.2.1 思维链的应用方法 54
4.2.2 思维链的应用案例 55
4.2.3 思维链的优势与挑战 56
4.3 RAG 57
4.3.1 RAG的工作原理 58
4.3.2 RAG的核心优势 59
4.3.3 RAG的应用场景 59
4.4 提示工程的最佳实践 60
4.4.1 理解任务与目标 60
4.4.2 设计具体和清晰的提示词 61
4.4.3 引导大模型关注关键细节 62
4.4.4 迭代优化提示词 62
4.4.5 确保提示词的公平性与包容性 63
4.4.6 持续监控并调整提示词 64
4.5 实验4:提示工程实战 64
4.5.1 实验目的 64
4.5.2 实验步骤 64
4.5.3 实验总结与评估 65
第5章 多媒体内容的生成 66
5.1 AIGC的本质 67
5.1.1 多媒体内容的基本构成要素解析 67
5.1.2 多媒体内容的生成原理 69
5.2 两种生成策略 70
5.2.1 自回归生成 70
5.2.2 非自回归生成 71
5.3 AIGC驱动的多媒体内容生成 72
5.3.1 图像的生成 73
5.3.2 扩散模型 77
5.3.3 音频的生成 82
5.3.4 视频的生成 84
5.4 实验5:AI短视频制作探索 86
5.4.1 实验目的 86
5.4.2 实验步骤 86
5.4.3 实验总结与评估 86
第6章 RAG与微调 88
6.1 RAG的基本原理与工作流程 89
6.1.1 什么是RAG 89
6.1.2 为什么需要RAG 91
6.1.3 RAG的工作流程 95
6.1.4 RAG的适用场景 98
6.2 AI Agent(智能体) 99
6.2.1 Agent特征分析 100
6.2.2 Agent的四种设计模式 103
6.3 微调 109
6.3.1 什么是微调 110
6.3.2 主要微调方法 111
6.3.3 微调的流程与最佳实践 113
6.4 实验6:设计与本地文档对话的智能体 116
6.4.1 实验目的 116
6.4.2 实验步骤 117
6.4.3 实验总结与评估 118
第7章 行业赋能 119
7.1 生成式人工智能赋能千行百业 120
7.1.1 经济价值创造 121
7.1.2 关键领域的价值聚焦 121
7.1.3 行业影响 121
7.1.4 工作活动自动化 122
7.1.5 生产力提升 122
7.2 教育创新赋能 122
7.2.1 教学环节的智能化提升 123
7.2.2 学生学习方式的变革 123
7.2.3 教育管理的智能化 124
7.2.4 教育资源的普及 124
7.2.5 智能教育生态的构建 124
7.2.6 教育行业落地场景 124
7.3 医疗健康赋能 125
7.3.1 药物研发与新药发现 126
7.3.2 疾病诊断与早期筛查 126
7.3.3 个性化治疗与精准医疗 127
7.3.4 患者管理与健康服务 127
7.3.5 人工智能医疗落地场景 128
7.4 消费零售赋能 130
7.4.1 利用大模型重塑品牌与消费者的连接 131
7.4.2 消费领域落地场景 132
7.5 智能制造赋能 133
7.5.1 通过大模型实现制造业的智能化升级 134
7.5.2 智能制造落地场景 134
7.6 游戏娱乐赋能 135
7.6.1 大模型助力游戏创作与设计 136
7.6.2 生成式人工智能推动娱乐体验的个性化 136
7.6.3 虚拟人物与虚拟世界的创造 136
7.6.4 游戏内经济与虚拟物品创造 136
7.6.5 游戏娱乐落地场景 137
7.7 实验7:角色扮演类多智能体应用设计体验 137
7.7.1 实验目的 137
7.7.2 实验步骤 138
7.7.3 实验总结与评估 139
第8章 生成式人工智能应用的构建 140
8.1 LangGraph简介 141
8.1.1 LangGraph的核心概念 142
8.1.2 LangGraph的优势与应用场景 142
8.2 任务1:基础对话系统的设计 143
8.2.1 创建模型 144
8.2.2 定义图的状态(MessageState) 146
8.2.3 创建LLM节点 146
8.2.4 构建图 147
8.2.5 运行测试 147
8.3 任务2:为系统添加工具调用能力 148
8.3.1 Reducer函数 149
8.3.2 创建工具(乘法器) 149
8.3.3 构建图 150
8.3.4 运行测试 150
8.4 任务3:为系统添加路由能力 151
8.4.1 构建图 152
8.4.2 运行测试 153
8.5 任务4:智能体的创建 153
8.5.1 创建工具(四则运算器) 154
8.5.2 使用提示词引导大模型 155
8.5.3 构建图 155
8.5.4 运行测试 156
8.6 任务5:具有记忆的智能体的创建 157
8.6.1 MemorySaver检查点 158
8.6.2 设置线程ID 159
8.7 任务6:Web界面的创建 161
8.7.1 Gradio简介 162
8.7.2 使用Gradio为“四则计算器”智能体添加Web界面 163