杨博
展开
译者序
随着信息处理技术、计算机技术和通信技术的迅猛发展,多媒体技术应运而生,并已经成为一项最具活力、发展速度很快的新兴技术之一。多媒体技术突破了计算机、通信、电视等传统产业间相对独立发展的界限,将多种前沿技术有机融合在一起。多媒体技术的广泛应用已经对人们的生产、生活产生了深刻的影响,可以预见,它必将成为科技进步、经济发展、人们生活质量提高的主要推动力之一。
原著Multimedia Signal Coding and Transmission是Springer出版社“信号与通信技术”系列丛书中的一部优秀著作。它由国际著名学者Jens-Rainer Ohm教授积多年科研和教学经验编撰而成。Ohm教授是被誉为欧洲“麻省理工学院”的德国亚琛工业大学(RWTH Aachen)通信工程研究所的所长,H.264/AVC、H.265/HEVC标准的主要制定者之一,国际电信联盟(ITU)联合视频协作组(JVC-VC)主席,德国工程师协会信息技术组发言人,国际视频编码标准制定过程中的领军人物及视频信号处理领域的权威学者。
本书紧密联系现代多媒体系统的发展需要,将多媒体信息处理(编码)与无线及有线通信传输融为一体,系统地介绍了多媒体信号与信息处理的基础理论以及研发、应用的成果。全书共9章,涵盖了图像、视频、语音和音频的压缩及表示的理论背景和多方面应用,并通过举例,使读者的理解更加深入。内容深入浅出,适合视频信号处理的初学者阅读;大多数章节都辅以练习题,适合学生进行课程学习;书中包括视频信号处理的前沿动态与应用,可为工业多媒体通信系统的研究人员和开发人员提供参考。
第1章概论:主要引入和介绍基本概念。第2章基础知识:介绍信号与系统的基本知识、傅里叶变换、多媒体信号的采样、离散信号处理、统计分析、线性预测、线性块变换与滤波器组变换等内容。第3章感知与质量:介绍人类的视觉/听觉特性,引入信号质量评价标准。第4章量化与编码:介绍标量量化和脉冲编码调制、编码理论、量化器的率失真优化、熵编码、向量量化等知识。第5章信号压缩方法:包括行程编码、预测编码、变换编码、可伸缩编码、多描述编码和分布式信源编码等。第6章帧内编码:包括二值图像编码、多幅值图像编码、无损和近无损图像编码、三维图像编码、重构滤波与静止图像编码标准等。第 7 章帧间编码:介绍混合视频编码、时空变换编码、可伸缩视频编码、多视图编码及视频编码标准等内容。第8章语音与音频编码:包括语音、音频、音乐和声音编码的方法与标准等。第 9 章多媒体数据的传输与储存:包括数字多媒体服务、网络接口、媒体储存与传输的相关知识等。
本书由卢鑫、金雪松、顾谦翻译,其中卢鑫博士翻译前言、第1章、第2章、第4章、第6章、第7章、第8章、第9章,金雪松博士翻译第3章,顾谦硕士翻译第5章、附录A、附录B、附录C、附录E。顾谦硕士、余唱硕士、周必兴硕士协助校对了全书的图表和公式。赵志杰教授负责全书的审校。
本书在翻译过程中,得到了多位老师和研究生的帮助与参与。特别需要感谢英国华威大学(University of Warwick)的Graham R. Martin教授为本书的翻译提供的宝贵意见和建议。感谢同学们的辛苦校对,感谢译者家人对本书翻译工作的支持与帮助,感谢杨博编辑在本书出版过程中付出的辛勤劳动。
本书的出版得到了国家自然科学基金重点国际合作研究项目(61720106002)、国家自然科学基金青年基金项目(61401123)、中央高校基本科研业务费专项资金(HIT.NSRIF.201617)、哈尔滨市科技创新人才项目(优秀学科带头人2017RAXXJ055)等的支持,在此表示衷心感谢。
由于时间仓促,译者水平有限,译文中如有不妥之处,恳请广大读者谅解,并提出改进意见,不胜感激!
卢 鑫
于哈尔滨
2017年7月
前言
近几十年来,数字视听信息在专业领域及日常生活中可谓无处不在。视听媒体已经深刻地改变了人们沟通合作、信息获取、学习、工作以及交互的方式。与此同时,传统的分发和访问方式已被互联网、移动网络和数字存储逐渐取代。在此背景下,多媒体通信构建了人与/或机器之间进行通信的全新模式,其特点包括普遍性、综合性、交互性以及智能性。
多媒体通信系统课程在亚琛工业大学已开设多年,本书连同Multimedia Content Analysis 正是以该课程的讲义为基础,是2004年出版的教材《多媒体通信技术》(Multimedia Communication Technology)的全面升级版。多媒体信号编码和传输是本书讨论的主要内容,而另一本书《多媒体数据内容分析》(Multimedia Content Analysis,MCA)则主要围绕多媒体信号的识别展开。这两本书中的内容(以及作为这两本书基础的课程讲义)都是自成体系的,因此不能将其理解为一套图书的上部和下部。但是,编码和内容分析之间存在着许多共性问题(两者都建立在信号处理和信息论的思想基础上),因此,读者经常会发现两书之间存在交叉引用(包括指向章节号的索引)的情况。关于信号处理(Signal Processing,SP)和信息论(Information Theory,IT)的基本知识有助于对本书内容的理解,因此,第2章和第4章针对相关的基本概念进行了总结。
自《多媒体通信技术》(2004 版)出版以来,视听数据的压缩技术又取得了惊人的进展。因此,本书体现了该领域的最新进展,其中包括关于高效视频编码(High Efficiency Video Coding,HEVC)标准所运用的编码思想的更深层次理解,以及三维视频和音频数据的压缩方法,同时本书还简述了未来可能的发展趋势。但是,本书无意阐述现有标准的具体实现细节,而是侧重于为读者提供关于基本概念的深入理解,最终为读者成为掌握该领域新兴技术的设计人员提供支持。
本书多数章节都辅以习题加以补充,访问网址http://www.ient.rwth-aachen.de可以获得参考答案 。
本书的出版离不开学术和标准化机构中广大师生、科技人员及同事们的贡献,以及25年来在图像、视频、音频的处理、编码和识别领域与本人开展合作的其他人员的努力。为简洁起见,不进行一一致谢,在此向所有人一并表示感谢。
Jens-Rainer Ohm
于德国亚琛
2014年12月21日
展开