图书简介:
项目1 Python爬虫 1
学习目标 1
情景描述 2
项目分解 2
项目实施 3
任务1.1 爬取静态网页:获取某企业官网导航栏中的标题和超链接 3
1.1.1 使用Chrome开发者工具查看网页 4
1.1.2 使用Beautiful Soup库解析网页 7
1.1.3 将数据存储至CSV文件 9
任务1.2 爬取动态网页:获取百度首页导航栏中的标题和超链接 10
1.2.1 下载浏览器驱动 10
1.2.2 使用Selenium打开浏览对象并访问页面 11
1.2.3 定位导航栏节点并获取内容 11
1.2.4 将数据存储至MySQL数据库 12
项目总结 13
实训工单 14
项目2 招聘网站实习信息采集与分析 18
学习目标 18
情景描述 19
项目分解 19
项目实施 20
任务2.1 采集数据 20
2.1.1 采集招聘网站中的实习信息 21
2.1.2 保存爬取的数据 24
任务2.2 预处理数据 25
2.2.1 规范化数据 25
2.2.2 清洗数据 29
任务2.3 可视化分析 31
2.3.1 分析岗位需求的分布与趋势 31
2.3.2 分析实习时长与公司规模 35
2.3.3 分析薪资待遇的影响因素 38
项目总结 42
实训工单 42
项目3 商超用户价值聚类分析 47
学习目标 47
情景描述 48
项目分解 48
项目实施 49
任务3.1 数据探索与可视化分析 49
3.1.1 数据质量评估与预处理 49
3.1.2 可视化分析 52
3.1.3 相关性分析 62
任务3.2 构建聚类模型并分析结果 64
3.2.1 筛选与构造建模指标 64
3.2.2 构建与训练聚类模型 66
3.2.3 聚类结果分析 68
项目总结 73
实训工单 73
项目4 天问一号相关事件评论情感类型分类 78
学习目标 78
情景描述 78
项目分解 79
项目实施 80
任务4.1 数据探索与预处理 80
4.1.1 数据探索 81
4.1.2 文本预处理 85
4.1.3 绘制词云图 88
任务4.2 构建情感类型分类模型 92
4.2.1 构建与训练情感分类模型 92
4.2.2 模型评估 97
项目总结 99
实训工单 99
项目5 智慧政务中的问政舆情分析 103
学习目标 103
情景描述 103
项目分解 104
项目实施 105
任务5.1 问政文本探索分析 105
5.1.1 不同留言数据类别的数量分布 106
5.1.2 不同留言数据类别的分布情况 108
任务5.2 问政文本预处理与特征工程 109
5.2.1 数据清洗 109
5.2.2 文本分词与停用词过滤 110
5.2.3 词云图分析 111
5.2.4 词向量提取 115
5.2.5 数据平衡 116
任务5.3 构建与训练问政分类模型 116
5.3.1 定义模型评估指标 117
5.3.2 SVM模型 118
5.3.3 逻辑回归模型 119
项目总结 121
实训工单 121
项目6 传感器数据采集 125
学习目标 125
情景描述 125
项目分解 126
项目实施 126
任务6.1 硬件部署 126
6.1.1 树莓派平台部署 126
6.1.2 传感器选用 141
6.1.3 连接GPIO 143
任务6.2 环境数据采集与展示 145
6.2.1 LED功能开发 145
6.2.2 蜂鸣监测功能开发 149
6.2.3 温湿监测功能开发 152
6.2.4 亮度监测功能开发 158
6.2.5 OLED显示功能开发 162
6.2.6 声音监测功能开发 165
6.2.7 模块整合 168
6.2.8 结果展示 175
项目总结 176
实训工单 176
项目7 基于YOLOv8的目标检测 181
学习目标 181
情景描述 181
项目分解 182
项目实施 183
任务7.1 准备数据 183
7.1.1 创建项目工程结构 184
7.1.2 划分数据集 186
7.1.3 转换数据集格式 188
任务7.2 构建YOLOv8主干网络 190
7.2.1 构建C2F模块 190
7.2.2 构建Bottleneck模块 192
任务7.3 编译与训练网络 194
7.3.1 编写数据集配置文件 194
7.3.2 训练模型 195
任务7.4 评估模型与分析结果 198
7.4.1 分析训练结果 199
7.4.2 评估模型效果 203
项目总结 204
实训工单 205
项目8 智能感知应用 209
学习目标 209
情景描述 209
项目分解 210
项目实施 211
任务8.1 环境感知 211
任务8.2 传感器开发 212
8.2.1 超声波传感器开发 212
8.2.2 摄像传感器开发 217
8.2.3 模块整合 221
任务8.3 模型部署 223
8.3.1 模型训练与验证 224
8.3.2 模型部署与评估 234
项目总结 240
实训工单 241
展开
当前,人工智能正以前所未有的速度重塑全球经济格局,推动各行各业向智能化、数字化转型。在这一背景下,互联网、大数据、云计算、区块链等数字技术加速创新融合,企业对具备数据分析能力、算法开发能力和工程实践能力的复合型人才的需求日益迫切,尤其是在智能制造、智慧城市、智慧医疗等领域,人工智能数据服务发挥着不可替代的作用,成为推动科技创新和产业升级的重要力量。
为适应科技发展、技术进步带来的新变化,顺应行业数字化、网络化、智能化发展的新趋势,对接新产业、新业态、新模式下人工智能工程技术人员、人工智能训练师等职业的新要求,不断满足产业高质量发展对高素质技能人才的需求,本书以教育部高等职业院校人工智能技术应用专业教学标准为依据,面向人工智能数据服务的典型应用场景,结合人工智能训练师与大数据应用开发(Python)职业技能等级证书的考核要求,系统整合Python数据采集技术与树莓派人工智能应用开发内容。通过对本书的学习,学生能够掌握数据采集、预处理、分析与建模等核心技能,具备在实际项目中运用Python技术进行数据处理与人工智能应用开发的综合能力。
中国特色社会主义已进入新时代,为实现中华民族伟大复兴的中国梦开启新征程。党的二十大报告指出,要“建设现代化产业体系”,并做出“推动战略性新兴产业融合集群发展,构建新一代信息技术、人工智能、生物技术、新能源、新材料、高端装备、绿色环保等一批新的增长引擎”的战略部署。科技是第一生产力、人才是第一资源、创新是第一动力,深入实施科教兴国战略、人才强国战略、创新驱动发展战略,开辟发展新领域新赛道,不断塑造发展新动能新优势。本书内容紧跟科技发展,注重价值引领,可激发学生科技创新的兴趣和潜能,使其成长为科技创新的主力军。
本书以任务为导向,全面介绍Python数据采集分析与应用技术,包括Python爬虫、招聘网站实习信息采集与分析、商超用户价值聚类分析、天问一号相关事件评论情感类型分类、智慧政务中的问政舆情分析、传感器数据采集、基于YOLOv8的目标检测、智能感知应用。通过对本书的学习,学生不仅能掌握Python在数据采集和人工智能应用中的核心技术,还能为未来的职业发展打下坚实基础。
在编写本书时,编写团队秉持着落实立德树人根本任务的原则,结合新时代大学生必须具备的数据采集与分析素养、计算思维和人工智能技术应用能力的要求,遵循学生的认知心理和学习习惯,采用“岗位需求、项目引领、任务驱动”的学习理念构建教程框架体系,由浅入深地精选和安排学习内容,促进学生在“做中学,学中用”,强化其实践性、应用性,为其终身发展奠定基础。
按照“大项目、小任务”的体例结构,全书由8个项目(含21个任务)组成。每个项目设计了“学习目标”“情景描述”“项目分解”“项目实施”“项目总结”“实训工单”6个模块。
内容与学时安排
序号 内容 建议学时
1 Python爬虫 4
2 实习网站招聘信息采集与分析 6
3 商超用户价值聚类分析 8
4 天问一号相关事件评论情感类型分类 6
5 智慧政务中的问政舆情分析 8
6 传感器数据采集 10
7 基于YOLOv8的目标检测 6
8 智能感知应用 6
合计 54
本书由广东行政职业学院组织策划,王圆、张良均担任主编,周胜安、李强、王嫣然、胡姣担任副主编,张译匀参与课程微课视频录制,全书由王圆统稿。本书采用新形态工作手册式编写方式,选取企业一线真实、有效的项目案例资源,融合了人工智能训练师与大数据应用开发(Python)职业技能等级证书的考试内容,是广东行政职业学院与广东泰迪智能科技股份有限公司的校企合作成果。
为了方便教师教学,本书配套丰富的教学资源,包括但不限于程序源文件、课件、微课、习题、课程大纲、实训指导书等各项资料,请有需要的教师登录华信教育资源网注册后免费下载,或者登录泰迪云教材获取资源。如有问题,可在网站的留言板留言或与电子工业出版社联系(hxedu@phei.com.cn)。
鉴于新一代信息技术日新月异,所以在使用相关技术时,可能与书中描述有细微差异。同时,限于编者水平,书中难免存在不足之处,敬请广大读者、同仁提供宝贵意见和建议,以便再版时予以修正。
编 者
展开