图书简介:
第 1 章 数据标注基础 ..................................................................................................................... 1
1.1 数据标注定义 .................................................................................................................... 3
1.1.1 任务分类 ................................................................................................................. 3
1.1.2 数据标注项目的工作流程 ..................................................................................... 4
1.2 计算机视觉标注相关基础概念 ........................................................................................ 4
1.2.1 图像 ......................................................................................................................... 5
1.2.2 视频 ......................................................................................................................... 8
1.3 自然语言处理标注相关基础概念 .................................................................................. 10
1.3.1 文件格式 ............................................................................................................... 10
1.3.2 字符编码 ............................................................................................................... 13
1.4 语音标注相关基础概念 .................................................................................................. 14
1.4.1 声音信号 ............................................................................................................... 14
1.4.2 数字声音 ............................................................................................................... 15
1.4.3 音频格式 ............................................................................................................... 16
1.5 标注环境安装和配置 ...................................................................................................... 16
1.5.1 MiniConda 的安装和配置 .................................................................................... 16
1.5.2 Label Studio 的安装和配置 .................................................................................. 17
1.5.3 Label Studio 的基本使用方法 .............................................................................. 18
1.6 数据标注项目和质量控制 .............................................................................................. 23
1.6.1 标注项目需求 ....................................................................................................... 23
1.6.2 团队组建 ............................................................................................................... 23
1.6.3 质量控制 ............................................................................................................... 24
1.6.4 标注员职业素养 ................................................................................................... 26
1.7 动手实践 .......................................................................................................................... 26
小结 ........................................................................................................................................... 27
课后习题 ................................................................................................................................... 27
第 2 章 图像标注项目 ................................................................................................................... 29
2.1 图像标签分类标注任务 .................................................................................................. 29
2.1.1 相关基础知识 ....................................................................................................... 29
2.1.2 典型应用场景 ....................................................................................................... 29
2.1.3 实践标注操作 ....................................................................................................... 30
2.1.4 动手实践 ............................................................................................................... 38
2.2 图像目标检测标注任务 .................................................................................................. 39
2.2.1 目标检测标注 ....................................................................................................... 39
2.2.2 小目标检测标注 ................................................................................................... 50
2.3 图像分割标注任务 .......................................................................................................... 67
2.3.1 语义分割标注任务 ............................................................................................... 67
2.3.2 实例分割标注任务 ............................................................................................... 74
2.3.3 全景分割标注任务 ............................................................................................... 80
2.4 关键点标注任务 .............................................................................................................. 87
2.4.1 相关基础知识 ....................................................................................................... 87
2.4.2 典型应用场景 ....................................................................................................... 87
2.4.3 实践标注操作 ....................................................................................................... 88
2.4.4 动手实践 ............................................................................................................... 92
小结 ........................................................................................................................................... 93
课后习题 ................................................................................................................................... 94
第 3 章 视频标注项目 ................................................................................................................... 95
3.1 视频分类标注任务 .......................................................................................................... 95
3.1.1 相关基础知识 ....................................................................................................... 95
3.1.2 典型应用场景 ....................................................................................................... 96
3.1.3 实践标注操作 ....................................................................................................... 98
3.1.4 动手实践 ............................................................................................................. 104
3.2 视频跨帧追踪标注任务 ................................................................................................ 104
3.2.1 相关基础知识 ..................................................................................................... 104
3.2.2 典型应用场景 ..................................................................................................... 104
3.2.3 实践标注操作 ..................................................................................................... 107
3.2.4 动手实践 ............................................................................................................. 115
小结 ......................................................................................................................................... 115
课后习题 ................................................................................................................................. 116
第 4 章 自然语言标注项目 ......................................................................................................... 118
4.1 命名实体识别标注任务 ................................................................................................ 118
4.1.1 相关基础知识 ..................................................................................................... 118
4.1.2 典型应用场景 ..................................................................................................... 119
4.1.3 数据标注方式 ..................................................................................................... 120
4.1.4 实践标注操作 ..................................................................................................... 121
4.1.5 动手实践 ............................................................................................................. 127
4.2 文本分类标注任务 ........................................................................................................ 128
4.2.1 相关基础知识 ..................................................................................................... 128
4.2.2 典型应用场景 ..................................................................................................... 129
4.2.3 数据标注方式 ..................................................................................................... 131
4.2.4 实践标注操作 ..................................................................................................... 131
4.2.5 动手实践 ............................................................................................................. 138
4.3 文本关系抽取标注任务 ................................................................................................ 138
4.3.1 相关基础知识 ..................................................................................................... 138
4.3.2 典型应用场景 ..................................................................................................... 140
4.3.3 数据标注方式 ..................................................................................................... 141
4.3.4 实践标注操作 ..................................................................................................... 142
4.3.5 动手实践 ............................................................................................................. 151
4.4 文本摘要标注任务 ........................................................................................................ 152
4.4.1 相关基础知识 ..................................................................................................... 152
4.4.2 典型应用场景 ..................................................................................................... 152
4.4.3 数据标注方式 ..................................................................................................... 153
4.4.4 实践标注操作 ..................................................................................................... 154
4.4.5 动手实践 ............................................................................................................. 159
4.5 生成对话标注任务 ........................................................................................................ 159
4.5.1 相关基础知识 ..................................................................................................... 159
4.5.2 典型应用场景 ..................................................................................................... 160
4.5.3 数据标注方式 ..................................................................................................... 161
4.5.4 实践标注操作 ..................................................................................................... 162
4.5.5 动手实践 ............................................................................................................. 169
小结 ......................................................................................................................................... 169
课后习题 ................................................................................................................................. 170
第 5 章 语音标注项目 ................................................................................................................. 172
5.1 自动语音识别标注任务 ................................................................................................ 172
5.1.1 相关基础知识 ..................................................................................................... 172
5.1.2 典型应用场景 ..................................................................................................... 173
5.1.3 实践标注操作 ..................................................................................................... 174
5.1.4 动手实践 ............................................................................................................. 179
5.2 说话人语音分割标注任务 ............................................................................................ 179
5.2.1 相关基础知识 ..................................................................................................... 179
5.2.2 典型应用场景 ..................................................................................................... 180
5.2.3 实践标注操作 ..................................................................................................... 181
5.2.4 动手实践 ............................................................................................................. 188
5.3 声音事件检测标注任务 ................................................................................................ 189
5.3.1 相关基础知识 ..................................................................................................... 189
5.3.2 典型应用场景 ..................................................................................................... 189
5.3.3 实践标注操作 ..................................................................................................... 191
5.3.4 动手实践 ............................................................................................................. 197
5.4 语音意图分类标注任务 ................................................................................................ 197
5.4.1 相关基础知识 ..................................................................................................... 197
5.4.2 典型应用场景 ..................................................................................................... 198
5.4.3 实践标注操作 ..................................................................................................... 199
5.4.4 动手实践 ............................................................................................................. 209
小结 ......................................................................................................................................... 209
课后习题 ................................................................................................................................. 210
展开
前 言
党的二十大报告指出:“教育、科技、人才是全面建设社会主义现代化国家的基础性、战
略性支撑。”职业教育作为教育事业的一个重要组成部分,其目的是培养应用型人才,以及具
有一定文化水平与专业知识技能的社会主义劳动者和建设者。职业教育侧重对学生进行实践
技能和实际工作能力的培养。在职业院校中,“人工智能数据标注”是人工智能专业的一门
重要课程。
本书面向人工智能相关专业学生,借鉴了目前国内已经出版的相关教材的先进理念,吸
收了一流高职院校中品牌专业建设的优秀经验,并对接《人工智能工程技术人员国家职业技
术技能标准》和《人工智能训练师国家职业技能标准》,以期达到新时代人工智能相关专业人
才培养的目标。本书的设计从对应的就业岗位调研入手,通过分析得到典型的工作任务,遵
循“内容由易到难、能力逐层提升”的原则对工作任务进行整合,并提炼出相应的工作情景。
本书以产业实践要求为纲,激发学生的学习兴趣,培养学生的奋斗精神,为其今后对相关知
识的深入学习打下良好基础。
本书特点
(1)教材内容与电子资源一体化、教材编写与课程开发一体化。通过对信息技术与教学
内容进行整合,突出数据标注的实操性特点,并针对重点、难点内容,制作微课视频。学生通
过扫描二维码即可在线观看这些微课视频。
(2)遵循项目驱动教学的理念设计学习过程。学生通过操作可以完成实践案例。
(3)按照课程思政的基本要求,将思政之“盐”有效融入教材。
本书组织
本书共 5 章,具体内容如下。
第 1 章 数据标注基础。主要介绍图像、视频、自然语言及语音的相关基础概念,以及
标注工具平台的安装和基本使用方法。
第 2 章 图像标注项目。主要介绍图像标签分类、图像目标检测、图像分割和关键点项
目的建立,以及标注过程等相关内容。
第 3 章 视频标注项目。主要介绍视频分类、视频跨帧追踪项目的建立,以及标注过程
等相关内容。
人工智能数据标注实战教程
IV
第 4 章 自然语言标注项目。主要介绍命名实体识别、文本分类、文本关系抽取、文本
摘要和生成对话项目的建立,以及标注过程等相关内容。
第 5 章 语音标注项目。主要介绍自动语音识别、说话人语音分割、声音事件检测和语
音意图分类项目的建立,以及标注过程等相关内容。
本书适用
(1)可以作为应用型本科院校和高职院校人工智能相关专业的数据标注教材,建议学时
为 48 学时。
(2)可以作为具有一定人工智能基础的人员的学习资料。
(3)可以作为人工智能数据标注工作从业人员的参考资料。
(4)可以作为利用业余时间学习数据标注技能的人员的学习资料。
教学资源
本书由天津电子信息职业技术学院张波、耿韶光和刘鹏担任主编,并负责拟定全书的内
容和案例。具体分工为:第 1 章和第 4 章由张波编写;第 3 章和第 5 章由耿韶光编写;第 2
章由刘鹏编写。
本书的配套电子资源包括微课视频、教学案例素材、教案、课程标准及相关扩展资料等。
读者若有需要,请登录华信教育资源网(http://www.hxedu.com.cn)注册后免费下载本书的配
套电子资源。
感谢
本书的编写得到了腾讯中国、中科闻歌、起硕科技等多家高科技企业的支持,并得到了
电子工业出版社的大力帮助,在此表示衷心的感谢!
感谢各位读者在茫茫书海之中选择本书,衷心祝愿您能够有所收获。由于编者水平有限,
书中难免有疏漏和不足之处,敬请广大读者批评指正。欢迎读者发送邮件到
zhangbo@tjdz.edu.cn 进行交流。
展开