图书简介:
项目1 环保调查问卷系统实现 1
任务1 使用Python创建问卷 6
1.1.1 Python脚本文件 8
1.1.2 Python编码设置 9
1.1.3 print()函数 9
1.1.4 运行Python脚本 9
任务2 实现用户信息交互 10
1.2.1 变量与字面量 12
1.2.2 数据类型 12
1.2.3 注释 13
任务3 校验用户信息 14
1.3.1 控制结构 16
1.3.2 分支结构 17
任务4 采集并评估用户问卷数据 18
1.4.1 for循环 20
1.4.2 while循环 21
1.4.3 第三方包的安装与导入 22
拓展实训:随机加减法出题程序的实现 23
项目考核 23
项目2 疫苗物流信息监测系统实现 25
任务1 管理员登录功能的实现 28
2.1.1 函数的定义 30
2.1.2 函数的调用 31
任务2 疫苗数据添加功能的实现 31
2.2.1 函数的返回 35
2.2.2 变量的作用域 37
任务3 疫苗信息统计功能的实现 38
2.3.1 形参与实参 41
2.3.2 位置参数与关键字参数 42
2.3.3 默认参数 44
2.3.4 可变参数 45
任务4 疫苗物流信息异常检测功能的实现 46
拓展实训:自定义难度的出题程序实现 49
项目考核 50
项目3 寻宝游戏实现 51
任务1 地图类的实现 54
3.1.1 面向对象 56
3.1.2 类的定义 57
3.1.3 类的实例化 58
任务2 玩家类的实现 59
3.2.1 类的成员 61
3.2.2 构造函数和析构函数 62
3.2.3 类成员修饰符 63
3.2.4 私有函数 63
任务3 战绩类的实现 64
3.3.1 公有属性和私有属性 67
3.3.2 get方法和set方法 68
任务4 超级玩家类的实现 70
3.4.1 父类和子类 73
3.4.2 属性的继承 73
3.4.3 方法的继承 74
拓展实训:飞机大战游戏的实现 75
项目考核 78
项目4 新能源汽车登记数据统计分析 79
任务1 登记数据的获取 82
4.1.1 数据来源 84
4.1.2 read_csv()函数 85
任务2 登记数据的解析 86
4.2.1 数据解析 88
4.2.2 缺失值处理 89
4.2.3 数据筛选 89
任务3 登记数据的描述性统计分析 90
4.3.1 描述性统计分析指标 92
4.3.2 groupby()函数 92
任务4 登记数据的可视化展现 93
4.4.1 数据可视化 95
4.4.2 统计分析结果展现形式 96
4.4.3 Matplotlib中的中文显示 96
4.4.4 Matplotlib图表绘制基础 96
拓展实训:数据统计分析应用 99
项目考核 102
项目5 用餐数据多维分析 104
任务1 用餐数据的集成和处理 107
5.1.1 数据集成 110
5.1.2 数据映射 111
5.1.3 数据类型转换 111
任务2 用餐数据的重复值检测和处理 112
5.2.1 检测重复值 113
5.2.2 删除重复值 113
任务3 用餐数据的缺失值检测和处理 113
5.3.1 检测缺失值 115
5.3.2 处理缺失值 115
任务4 用餐数据的异常值检测和处理 116
5.4.1 检测异常值 120
5.4.2 处理异常值 120
任务5 对用餐数据进行多维分析 121
5.5.1 分组分析 125
5.5.2 分布分析 125
5.5.3 交叉分析 126
5.5.4 结构分析 126
5.5.5 相关分析 127
拓展实训:对观影数据进行统计分析 128
项目考核 129
项目6 发电量数据推断统计分析 131
任务1 从MySQL数据库中读取数据 134
6.1.1 连接MySQL数据库 136
6.1.2 读取数据 136
任务2 对发电量进行时间序列分析 137
6.2.1 时间处理函数 139
6.2.2 时间序列分析 140
任务3 对发电量进行假设检验 141
6.3.1 独立性检验和自相关函数 144
6.3.2 正态性和S-W检验 145
6.3.3 方差齐性和Levene检验 146
任务4 对发电量进行方差分析 146
6.4.1 方差分析与F统计量 147
6.4.2 假设检验的步骤 147
拓展实训:风力发电数据推断统计 148
项目考核 149
项目7 电商平台用户消费数据分析 151
任务1 用户数据的创建 154
7.1.1 数组创建 156
7.1.2 数组数据类型 157
7.1.3 数组的索引和切片 159
任务2 用户数据的更新 161
7.2.1 随机数生成 164
7.2.2 数组操作 164
任务3 用户数据的分析 168
7.3.1 矩阵创建 169
7.3.2 基本数学函数 172
7.3.3 统计函数 175
拓展实训:用户数据RFM模型分析 176
项目考核 177
项目8 AI生成图像的处理和优化 179
任务1 图像基本操作 181
8.1.1 图像读取和保存 186
8.1.2 数组索引和切片的应用 187
8.1.3 数组基本运算 187
8.1.4 meshgrid()函数 188
任务2 图像缩放处理 188
8.2.1 repeat()函数 190
8.2.2 tile()函数 191
任务3 为图像添加框线 191
8.3.1 pad()函数 194
8.3.2 数组赋值运算 194
任务4 图像滤波和增强 195
8.4.1 NumPy聚合函数 198
8.4.2 NumPy随机数应用 199
8.4.3 clip()函数 199
任务5 图像边缘检测 199
8.5.1 Sobel算子 202
8.5.2 hypot()函数 202
拓展实训:医学影像的处理和优化 203
项目考核 204
项目9 房屋租赁数据可视化分析 206
任务1 房屋租赁价格统计分析 209
9.1.1 常用的统计分析函数 212
9.1.2 柱状图 213
9.1.3 直方图 214
9.1.4 hist()函数 214
任务2 房屋租赁价格分布分析 215
9.2.1 箱形图 216
9.2.2 boxplot()函数 217
任务3 房屋租赁价格相关因素分析 217
9.3.1 散点图 220
9.3.2 scatter()函数 221
任务4 房源占比分析 222
9.4.1 饼图 224
9.4.2 pie()函数 224
任务5 房屋租赁价格预测分析 225
9.5.1 sklearn简介 227
9.5.2 sklearn实现线性回归分析 227
9.5.3 折线图 228
9.5.4 plot()函数 228
任务6 房源地理位置分布分析 228
拓展实训:二手房数据可视化分析 232
项目考核 235
项目10 二手车数据可视化分析 237
任务1 使用常见图表对二手车数据进行分析 240
10.1.1 Seaborn简介 243
10.1.2 lineplot()函数 244
10.1.3 catplot()函数 244
任务2 使用词云图展现二手车市场的热门车型和城市 245
10.2.1 词云图 247
10.2.2 wordcloud简介 247
任务3 使用热力图展现二手车地理分布情况 248
10.3.1 Pyecharts简介 249
10.3.2 使用Pyecharts绘制地图 249
任务4 对二手车车龄、里程数进行分布分析 250
10.4.1 histplot()函数 254
10.4.2 violinplot()函数 254
10.4.3 swarmplot()函数 255
任务5 对二手车价格影响因素进行相关分析 255
10.5.1 heatmap()函数 258
10.5.2 jointplot()函数 258
10.5.3 pairplot()函数 259
任务6 对二手车数据进行回归分析 259
10.6.1 多项式回归 262
10.6.2 sklearn实现多项式回归 262
拓展实训:招考数据可视化分析 263
项目考核 264
附录A 266
附录B 267
参考文献 275
展开
在数字化、信息化的新时代背景下,数据已然成为推动社会进步的新质生产力。它与劳动力、资本、土地等传统要素并驾齐驱,并且在诸多领域中展现着不可或缺的作用。随着数据量的爆炸式增长,如何高效提取、精准分析、有效利用数据,已经成为当下的重要议题。
近年来,我国高度关注数据要素的价值,通过出台一系列政策积极推动大数据产业的发展,并且鼓励企业利用数据分析优化决策、提高运营效率和服务质量。
Python凭借其强大的功能和易上手的特性,迅速在数据处理和分析领域崭露头角,成为主流工具。它不仅拥有丰富的数据处理库和强大的数据分析能力,而且语法简洁明了,容易学习和掌握,因此深受数据分析师、数据科学家和广大数据爱好者的青睐。
为了满足数字化时代对数据分析人才的需求,众多高等职业院校和应用型本科院校纷纷开设数据分析相关课程,涵盖大数据技术、金融大数据、电子商务等多个专业方向。这些课程致力于培养学生收集、处理、分析和应用数据的能力,为学生在未来职场中应对挑战奠定坚实的基础。
然而,当前市场上的数据分析教材普遍存在理论性强、缺乏实践案例、与实际应用场景脱节等问题。为了弥补这些不足,我们亟须编写一本可读性强、实践性强、灵活性强的项目化教材,以满足高等职业院校和应用型本科院校学生提升职业技能的需求。
基于多年的教学经验、竞赛指导和数据开发经历,教材编写团队积极探索“岗课赛证”综合育人模式,于2020年启动本书的编写工作。在编写过程中,教材编写团队根据职业教育学生的特点和培养目标,不断改良项目,以帮助学生掌握岗位所需的知识和技能,使学生掌握数据分析的流程、常用的数据分析工具和方法,培养学生精益求精、追求卓越的工匠精神。
为使语言更准确、讲解更清楚,本书结合Python 3.11实现了对应项目。本书特色如下。
(1)案例精简,图文并茂,可读性强。本书尽量使用简化后的案例,围绕具体任务讲解知识和技能要点,使学生能够快速阅读本书,快速掌握数据分析的思想、工具和基本方法。
(2)“岗课赛证”融通,内容实用,注重应用。本书对接《国家职业技术技能标准 大数据工程技术人员(2021年版)》,结合《大数据应用开发(Python)职业技能等级标准》等,根据全国工业和信息化技术技能大赛“工业大数据算法”赛项和全国职业院校技能大赛(高职组)“大数据应用开发”赛项的大纲制定内容。根据知识结构和数据分析流程,本书针对不同行业领域开发了10个独立项目,如新能源汽车登记数据统计分析、发电量数据推断统计分析、房屋租赁数据可视化分析等。
(3)应用导向,任务驱动,有利于学习。本书以应用为出发点,通过任务驱动的方式引入相关知识和技能要点,并且有针对性地设计了包含问题引导、评价细则等内容的任务单,读者可以边学边练,实现知识与技能的有机融合,满足职业教育人才建设的需求。
(4)提供源代码、课件、微课视频,方便学生参考和学习。为配合本书的教与学,编者制作了高质量的教学课件、配套实训项目和题解,供教师和学生使用。在后期,还会不断更新应用案例,建立“智慧职教”在线课程。
本书的编写得到了浙江省“十四五”教学改革研究项目立项支持(项目编号:jg20230057)、浙江省教育科学规划公益计划项目立项支持(项目编号:No. LQ23F020004),编者在此表示衷心的感谢。
本书由陈清华担任主编,由黄莹达、朱燕民、谢悦担任副主编,同时,田启明、章逸丰、邵剑集、王永军等参与了编写。其中,项目1~3由黄莹达、陈清华编写,项目4~5由陈清华、田启明编写,项目6由朱燕民、陈清华编写,项目7由谢悦、陈清华编写,项目8~9由陈清华编写,项目10由陈清华、章逸丰编写,全书由陈清华统稿,章逸丰、邵剑集、王永军等参与修订与审核。此外,要特别感谢温州职业技术学院、温州科技职业学院、上海交通大学、杭州景业智能科技股份有限公司的相关人员,他们的建议为本书内容的形成提供了很好的建议和帮助参考。
由于本书是黑白印刷,涉及的颜色无法在书中呈现,请读者结合软件界面进行辨识。为了方便教师教学,本书配有电子教学课件及相关资源,请有此需要的教师登录华信教育资源网(www.hxedu.com.cn)注册后免费下载,如有问题可在网站留言板留言或与电子工业出版社联系(E-mail:hxedu@phei.com.cn),还可与本书编者联系(E-mail:kegully@qq.com)。
教材建设是一项系统工程,需要在实践中不断完善和改进,同时由于编者水平有限,书中难免存在疏漏和不足之处,敬请同行专家和广大读者给予批评指正。
编 者
展开