华信教育资源网
数据分析Python项目化实践
丛   书   名: 浙江省高职院校“十四五”重点立项建设教材
作   译   者:陈清华 出 版 日 期:2025-02-01
出   版   社:电子工业出版社 维   护   人:徐建军 
书   代   号:G0494350 I S B N:9787121494352

图书简介:

本书以项目化实践为设计理念,专注于引导读者通过Python探索并提升数据分析的实战技能。在数据驱动时代,本书结合前沿技术和实际操作,通过精选案例,使读者能够在实践中理解并掌握数据分析的关键技术和方法。本书以掌握Python基础为前提,从10个精简案例入手,循序渐进地介绍数据分析工具在不同业务领域中的应用。本书强调实用性和操作性,每个项目都给出了具体实施步骤,帮助读者在实际操作中不断试错、学习和提高。
定价 59.0
您的专属联系人更多
关注 评论(0) 分享
配套资源 图书内容 样章/电子教材 图书评价
  • 配 套 资 源

    本书资源

    会员上传本书资源

  • 图 书 内 容

    内容简介

    本书以项目化实践为设计理念,专注于引导读者通过Python探索并提升数据分析的实战技能。在数据驱动时代,本书结合前沿技术和实际操作,通过精选案例,使读者能够在实践中理解并掌握数据分析的关键技术和方法。本书以掌握Python基础为前提,从10个精简案例入手,循序渐进地介绍数据分析工具在不同业务领域中的应用。本书强调实用性和操作性,每个项目都给出了具体实施步骤,帮助读者在实际操作中不断试错、学习和提高。

    图书详情

    ISBN:9787121494352
    开 本:16(185*260)
    页 数:288
    字 数:484

    本书目录

    项目1  环保调查问卷系统实现	1
    任务1  使用Python创建问卷	6
    1.1.1  Python脚本文件	8
    1.1.2  Python编码设置	9
    1.1.3  print()函数	9
    1.1.4  运行Python脚本	9
    任务2  实现用户信息交互	10
    1.2.1  变量与字面量	12
    1.2.2  数据类型	12
    1.2.3  注释	13
    任务3  校验用户信息	14
    1.3.1  控制结构	16
    1.3.2  分支结构	17
    任务4  采集并评估用户问卷数据	18
    1.4.1  for循环	20
    1.4.2  while循环	21
    1.4.3  第三方包的安装与导入	22
    拓展实训:随机加减法出题程序的实现	23
    项目考核	23
    项目2  疫苗物流信息监测系统实现	25
    任务1  管理员登录功能的实现	28
    2.1.1  函数的定义	30
    2.1.2  函数的调用	31
    任务2  疫苗数据添加功能的实现	31
    2.2.1  函数的返回	35
    2.2.2  变量的作用域	37
    任务3  疫苗信息统计功能的实现	38
    2.3.1  形参与实参	41
    2.3.2  位置参数与关键字参数	42
    2.3.3  默认参数	44
    2.3.4  可变参数	45
    任务4  疫苗物流信息异常检测功能的实现	46
    拓展实训:自定义难度的出题程序实现	49
    项目考核	50
    项目3  寻宝游戏实现	51
    任务1  地图类的实现	54
    3.1.1  面向对象	56
    3.1.2  类的定义	57
    3.1.3  类的实例化	58
    任务2  玩家类的实现	59
    3.2.1  类的成员	61
    3.2.2  构造函数和析构函数	62
    3.2.3  类成员修饰符	63
    3.2.4  私有函数	63
    任务3  战绩类的实现	64
    3.3.1  公有属性和私有属性	67
    3.3.2  get方法和set方法	68
    任务4  超级玩家类的实现	70
    3.4.1  父类和子类	73
    3.4.2  属性的继承	73
    3.4.3  方法的继承	74
    拓展实训:飞机大战游戏的实现	75
    项目考核	78
    项目4  新能源汽车登记数据统计分析	79
    任务1  登记数据的获取	82
    4.1.1  数据来源	84
    4.1.2  read_csv()函数	85
    任务2  登记数据的解析	86
    4.2.1  数据解析	88
    4.2.2  缺失值处理	89
    4.2.3  数据筛选	89
    任务3  登记数据的描述性统计分析	90
    4.3.1  描述性统计分析指标	92
    4.3.2  groupby()函数	92
    任务4  登记数据的可视化展现	93
    4.4.1  数据可视化	95
    4.4.2  统计分析结果展现形式	96
    4.4.3  Matplotlib中的中文显示	96
    4.4.4  Matplotlib图表绘制基础	96
    拓展实训:数据统计分析应用	99
    项目考核	102
    项目5  用餐数据多维分析	104
    任务1  用餐数据的集成和处理	107
    5.1.1  数据集成	110
    5.1.2  数据映射	111
    5.1.3  数据类型转换	111
    任务2  用餐数据的重复值检测和处理	112
    5.2.1  检测重复值	113
    5.2.2  删除重复值	113
    任务3  用餐数据的缺失值检测和处理	113
    5.3.1  检测缺失值	115
    5.3.2  处理缺失值	115
    任务4  用餐数据的异常值检测和处理	116
    5.4.1  检测异常值	120
    5.4.2  处理异常值	120
    任务5  对用餐数据进行多维分析	121
    5.5.1  分组分析	125
    5.5.2  分布分析	125
    5.5.3  交叉分析	126
    5.5.4  结构分析	126
    5.5.5  相关分析	127
    拓展实训:对观影数据进行统计分析	128
    项目考核	129
    项目6  发电量数据推断统计分析	131
    任务1  从MySQL数据库中读取数据	134
    6.1.1  连接MySQL数据库	136
    6.1.2  读取数据	136
    任务2  对发电量进行时间序列分析	137
    6.2.1  时间处理函数	139
    6.2.2  时间序列分析	140
    任务3  对发电量进行假设检验	141
    6.3.1  独立性检验和自相关函数	144
    6.3.2  正态性和S-W检验	145
    6.3.3  方差齐性和Levene检验	146
    任务4  对发电量进行方差分析	146
    6.4.1  方差分析与F统计量	147
    6.4.2  假设检验的步骤	147
    拓展实训:风力发电数据推断统计	148
    项目考核	149
    项目7  电商平台用户消费数据分析	151
    任务1  用户数据的创建	154
    7.1.1  数组创建	156
    7.1.2  数组数据类型	157
    7.1.3  数组的索引和切片	159
    任务2  用户数据的更新	161
    7.2.1  随机数生成	164
    7.2.2  数组操作	164
    任务3  用户数据的分析	168
    7.3.1  矩阵创建	169
    7.3.2  基本数学函数	172
    7.3.3  统计函数	175
    拓展实训:用户数据RFM模型分析	176
    项目考核	177
    项目8  AI生成图像的处理和优化	179
    任务1  图像基本操作	181
    8.1.1  图像读取和保存	186
    8.1.2  数组索引和切片的应用	187
    8.1.3  数组基本运算	187
    8.1.4  meshgrid()函数	188
    任务2  图像缩放处理	188
    8.2.1  repeat()函数	190
    8.2.2  tile()函数	191
    任务3  为图像添加框线	191
    8.3.1  pad()函数	194
    8.3.2  数组赋值运算	194
    任务4  图像滤波和增强	195
    8.4.1  NumPy聚合函数	198
    8.4.2  NumPy随机数应用	199
    8.4.3  clip()函数	199
    任务5  图像边缘检测	199
    8.5.1  Sobel算子	202
    8.5.2  hypot()函数	202
    拓展实训:医学影像的处理和优化	203
    项目考核	204
    项目9  房屋租赁数据可视化分析	206
    任务1  房屋租赁价格统计分析	209
    9.1.1  常用的统计分析函数	212
    9.1.2  柱状图	213
    9.1.3  直方图	214
    9.1.4  hist()函数	214
    任务2  房屋租赁价格分布分析	215
    9.2.1  箱形图	216
    9.2.2  boxplot()函数	217
    任务3  房屋租赁价格相关因素分析	217
    9.3.1  散点图	220
    9.3.2  scatter()函数	221
    任务4  房源占比分析	222
    9.4.1  饼图	224
    9.4.2  pie()函数	224
    任务5  房屋租赁价格预测分析	225
    9.5.1  sklearn简介	227
    9.5.2  sklearn实现线性回归分析	227
    9.5.3  折线图	228
    9.5.4  plot()函数	228
    任务6  房源地理位置分布分析	228
    拓展实训:二手房数据可视化分析	232
    项目考核	235
    项目10  二手车数据可视化分析	237
    任务1  使用常见图表对二手车数据进行分析	240
    10.1.1  Seaborn简介	243
    10.1.2  lineplot()函数	244
    10.1.3  catplot()函数	244
    任务2  使用词云图展现二手车市场的热门车型和城市	245
    10.2.1 词云图	247
    10.2.2  wordcloud简介	247
    任务3  使用热力图展现二手车地理分布情况	248
    10.3.1  Pyecharts简介	249
    10.3.2  使用Pyecharts绘制地图	249
    任务4  对二手车车龄、里程数进行分布分析	250
    10.4.1  histplot()函数	254
    10.4.2  violinplot()函数	254
    10.4.3  swarmplot()函数	255
    任务5  对二手车价格影响因素进行相关分析	255
    10.5.1  heatmap()函数	258
    10.5.2  jointplot()函数	258
    10.5.3  pairplot()函数	259
    任务6  对二手车数据进行回归分析	259
    10.6.1  多项式回归	262
    10.6.2  sklearn实现多项式回归	262
    拓展实训:招考数据可视化分析	263
    项目考核	264
    附录A	266
    附录B	267
    参考文献	275
    
    展开

    前     言

    在数字化、信息化的新时代背景下,数据已然成为推动社会进步的新质生产力。它与劳动力、资本、土地等传统要素并驾齐驱,并且在诸多领域中展现着不可或缺的作用。随着数据量的爆炸式增长,如何高效提取、精准分析、有效利用数据,已经成为当下的重要议题。
    近年来,我国高度关注数据要素的价值,通过出台一系列政策积极推动大数据产业的发展,并且鼓励企业利用数据分析优化决策、提高运营效率和服务质量。
    Python凭借其强大的功能和易上手的特性,迅速在数据处理和分析领域崭露头角,成为主流工具。它不仅拥有丰富的数据处理库和强大的数据分析能力,而且语法简洁明了,容易学习和掌握,因此深受数据分析师、数据科学家和广大数据爱好者的青睐。
    为了满足数字化时代对数据分析人才的需求,众多高等职业院校和应用型本科院校纷纷开设数据分析相关课程,涵盖大数据技术、金融大数据、电子商务等多个专业方向。这些课程致力于培养学生收集、处理、分析和应用数据的能力,为学生在未来职场中应对挑战奠定坚实的基础。
    然而,当前市场上的数据分析教材普遍存在理论性强、缺乏实践案例、与实际应用场景脱节等问题。为了弥补这些不足,我们亟须编写一本可读性强、实践性强、灵活性强的项目化教材,以满足高等职业院校和应用型本科院校学生提升职业技能的需求。
    基于多年的教学经验、竞赛指导和数据开发经历,教材编写团队积极探索“岗课赛证”综合育人模式,于2020年启动本书的编写工作。在编写过程中,教材编写团队根据职业教育学生的特点和培养目标,不断改良项目,以帮助学生掌握岗位所需的知识和技能,使学生掌握数据分析的流程、常用的数据分析工具和方法,培养学生精益求精、追求卓越的工匠精神。
    为使语言更准确、讲解更清楚,本书结合Python 3.11实现了对应项目。本书特色如下。
    (1)案例精简,图文并茂,可读性强。本书尽量使用简化后的案例,围绕具体任务讲解知识和技能要点,使学生能够快速阅读本书,快速掌握数据分析的思想、工具和基本方法。
    (2)“岗课赛证”融通,内容实用,注重应用。本书对接《国家职业技术技能标准 大数据工程技术人员(2021年版)》,结合《大数据应用开发(Python)职业技能等级标准》等,根据全国工业和信息化技术技能大赛“工业大数据算法”赛项和全国职业院校技能大赛(高职组)“大数据应用开发”赛项的大纲制定内容。根据知识结构和数据分析流程,本书针对不同行业领域开发了10个独立项目,如新能源汽车登记数据统计分析、发电量数据推断统计分析、房屋租赁数据可视化分析等。
    (3)应用导向,任务驱动,有利于学习。本书以应用为出发点,通过任务驱动的方式引入相关知识和技能要点,并且有针对性地设计了包含问题引导、评价细则等内容的任务单,读者可以边学边练,实现知识与技能的有机融合,满足职业教育人才建设的需求。
    (4)提供源代码、课件、微课视频,方便学生参考和学习。为配合本书的教与学,编者制作了高质量的教学课件、配套实训项目和题解,供教师和学生使用。在后期,还会不断更新应用案例,建立“智慧职教”在线课程。
    本书的编写得到了浙江省“十四五”教学改革研究项目立项支持(项目编号:jg20230057)、浙江省教育科学规划公益计划项目立项支持(项目编号:No. LQ23F020004),编者在此表示衷心的感谢。
    本书由陈清华担任主编,由黄莹达、朱燕民、谢悦担任副主编,同时,田启明、章逸丰、邵剑集、王永军等参与了编写。其中,项目1~3由黄莹达、陈清华编写,项目4~5由陈清华、田启明编写,项目6由朱燕民、陈清华编写,项目7由谢悦、陈清华编写,项目8~9由陈清华编写,项目10由陈清华、章逸丰编写,全书由陈清华统稿,章逸丰、邵剑集、王永军等参与修订与审核。此外,要特别感谢温州职业技术学院、温州科技职业学院、上海交通大学、杭州景业智能科技股份有限公司的相关人员,他们的建议为本书内容的形成提供了很好的建议和帮助参考。
    由于本书是黑白印刷,涉及的颜色无法在书中呈现,请读者结合软件界面进行辨识。为了方便教师教学,本书配有电子教学课件及相关资源,请有此需要的教师登录华信教育资源网(www.hxedu.com.cn)注册后免费下载,如有问题可在网站留言板留言或与电子工业出版社联系(E-mail:hxedu@phei.com.cn),还可与本书编者联系(E-mail:kegully@qq.com)。
    教材建设是一项系统工程,需要在实践中不断完善和改进,同时由于编者水平有限,书中难免存在疏漏和不足之处,敬请同行专家和广大读者给予批评指正。
    
    编  者
    
    展开

    作者简介

    陈清华,女,博士,教授、高级工程师,从事计算机研发及教学工作15余年,主要从事方向为数据挖掘、人工智能和群智感知,是"大数据技术”国家级职业教育创新教学团队核心成员,温州市"特支计划”科技创新青年拔尖人才、高层次D类人才,金砖国家职业技能大赛区块链技术赛项全国优秀专家。
  • 样 章 试 读
  • 图 书 评 价 我要评论
华信教育资源网