本书以VSCode为主要开发工具,全面系统地介绍了Python数据应用开发的相关知识。本书采用理论与案例相结合,多样化的案例、通俗易懂的讲解形式、详细的演示步骤,帮助大家轻松地学习Python数据分析的相关知识。全书共6个项目,前两个项目介绍了文件采集和MySQL与Python交互的应用,后面四个项目介绍了Python数据分析的常用库及其应用,涵盖了科学计算库NumPy、数据分析库Pandas、数据清洗和数据可视化库Matplotlib和pyecharts。每个项目中都结合所学的技术开发了综合实训,演示如何在项目中运用所学的知识,通过动手操作和练习,帮助读者更好地理解和掌握所学的知识。
		
	
蔺首晶, 毕业于哈尔滨师范大学计算机科学与技术专业本科学历,在东北财经大学获得硕士学位,"双师型”教师,自2005年至今,从教于大连电子学校软件及应用教学部,现任高级讲师,长期工作在职业院校计算机软件专业教学管理一线,有着较强的教育教学管理能力和丰富的教学经验,多次参编教材,主持、参与科研课题多项,在各项教学比赛、课件比赛中荣获国家级、省级、市级等多个奖项,多篇教学论文在国内期刊教育专栏发表并获奖。2021年被评为大连市职业院校骨干教师,具备很好的教学素质,并有一定的研究能力,可以带动身边的教师一起参与研究。
项目1  文件采集	001
1.1  第三方模块	002
1.1.1  第三方模块的概念	002
1.1.2  NumPy、Pandas模块的下载与安装	004
1.2  CSV格式化数据的读写	006
1.2.1  CSV文件和csv模块	006
1.2.2  使用NumPy模块读写CSV文件	013
1.2.3  Pandas读取和写入CSV文件	015
1.3  XML文件读写	017
1.3.1  XML文件结构	017
1.3.2  解析XML文件	018
1.4  JSON格式化数据的读写	020
1.4.1  JSON数据格式	020
1.4.2  JSON文件读取	020
1.5  Excel格式化数据的读写	024
1.5.1  使用xlrd和xlwt模块读写Excel文件	024
1.5.2  使用Pandas读写Excel文件	030
任务拓展	031
实训1:汽车数据写入CSV文件	031
实训2:网络数据爬取	038
课后练习	047
项目2  Python访问MySQL与MongoDB数据库	049
2.1  数据库基础	050
2.1.1  概述	050
2.1.2  数据库分类	051
2.2  MySQL与Python交互	052
2.2.1  pymysql库	052
2.2.2  访问及查询MySQL数据库	053
2.3  MongoDB与Python交互	064
2.3.1  pymongo库概述	064
2.3.2  访问MongoDB 数据库	064
任务拓展	069
实训3:构建基于MySQL与Python交互的汽车数据管理系统	069
课后练习	075
项目3  NumPy库	077
3.1  Ndarray对象	078
3.1.1  认识NumPy数组对象	078
3.1.2  创建NumPy数组	079
3.1.3  NumPy数组属性	081
3.1.4  NumPy切片和索引	083
3.2  NumPy数组操作	088
3.2.1  修改数组形状	089
3.2.2  连接数组	089
3.2.3  分割数组	093
3.2.4  数组元素的添加与删除	095
3.3  NumPy函数	098
3.3.1  NumPy通用函数	099
3.3.2  NumPy统计函数	102
任务拓展	108
实训4:管理手机卡用户数据	108
课后练习	117
项目4  Pandas库	119
4.1  Pandas数据结构	120
4.1.1  Series的组成及创建	120
4.1.2  DataFrame的组成及创建	123
4.1.3  DataFrame的数据切片与合并	127
4.1.4  numpy.array与pandas.DataFrame的转换	131
4.2  数据访问	132
4.2.1  获取DataFrame的字段信息	132
4.2.2  获取指定的行和列	135
4.2.3  获取数值型字段的统计信息	139
4.2.4  获取文本型字段的取值信息	140
任务拓展	141
实训5:药店数据维护与销售情况分析	141
课后练习	146
项目5  数据清洗	148
5.1  数据清洗	149
5.1.1  缺失值的处理	149
5.1.2  重复值的处理	155
5.1.3  异常值的处理	157
5.1.4  更改数据类型	161
5.2  数据转换	164
5.2.1  重命名轴索引	165
5.2.2  离散化连续数据	167
5.2.3  哑变量处理类别型数据	168
任务拓展	170
实训6:餐饮数据清洗	170
课后练习	177
项目6  数据可视化	179
6.1  数据可视化概述	180
6.1.1  什么是数据可视化	180
6.1.2  常见的图表类型	180
6.1.3  数据可视化工具	184
6.2  使用Matplotlib绘制图表	190
6.2.1  通过figure()函数创建画布	190
6.2.2  通过subplot()函数创建单个子图	194
6.2.3  通过subplots()函数创建多个子图	197
6.2.4  通过add_subplot()方法添加和选中子图	198
6.3  使用Matplotlib绘制其他简单图表	200
6.3.1  plot()函数绘制折线图	200
6.3.2  通过scatter()绘制散点图或气泡图	203
6.3.2  通过hist()函数绘制直方图	206
6.3.3  通过pie()函数绘制饼图或圆环图	208
6.3.4  通过barth()方法绘制条形图或堆积条形图	210
任务拓展	215
实训7:使用pyecharts 绘制常见图表	215
课后练习	235