华信教育资源网
Python数据分析基础教程—— 数据可视化(第2版)
丛   书   名: 数据科学与大数据技术系列
作   译   者:王斌会 出 版 日 期:2021-01-01
出   版   社:电子工业出版社 维   护   人:秦淑灵 
书   代   号:G0402770 I S B N:9787121402777

图书简介:

本书重点介绍Python语言在处理数据、分析数据及数据可视化方面的应用技巧,内容涉及数据分析软件介绍、数据的收集与整理、Python数据分析编程基础、数据的探索性分析及可视化、数据的直观分析及可视化、数据的统计分析及可视化、数据的模型分析及可视化、数据的预测分析及可视化、数据的决策分析及可视化、数据的在线分析及可视化。本书内容丰富,图文并茂,可操作性强且便于查阅,主要面向希望应用Python进行数据分析的读者,能有效地帮助读者提高数据处理与分析的水平,提升工作效率。书中的例子数据和习题数据都可在作者的学习博客http://Rstat.leanote.com下载使用,也可登录华信教育资源网http://www.hxedu.com.cn免费下载。本书适合各个层次的数据分析用户,既可作为初学者的入门指南,又可作为中、高级用户的参考手册,同时也可作为各大中专院校和培训班的数据分析教材。本书配套课程“数据可视化”已上线中国大学MOOC,读者可在线学习。
定价 48.0
您的专属联系人更多
关注 评论(3) 分享
配套资源 图书内容 样章/电子教材 图书评价
  • 配 套 资 源

    本书资源

    会员上传本书资源

  • 图 书 内 容

    内容简介

    本书重点介绍Python语言在处理数据、分析数据及数据可视化方面的应用技巧,内容涉及数据分析软件介绍、数据的收集与整理、Python数据分析编程基础、数据的探索性分析及可视化、数据的直观分析及可视化、数据的统计分析及可视化、数据的模型分析及可视化、数据的预测分析及可视化、数据的决策分析及可视化、数据的在线分析及可视化。本书内容丰富,图文并茂,可操作性强且便于查阅,主要面向希望应用Python进行数据分析的读者,能有效地帮助读者提高数据处理与分析的水平,提升工作效率。书中的例子数据和习题数据都可在作者的学习博客http://Rstat.leanote.com下载使用,也可登录华信教育资源网http://www.hxedu.com.cn免费下载。本书适合各个层次的数据分析用户,既可作为初学者的入门指南,又可作为中、高级用户的参考手册,同时也可作为各大中专院校和培训班的数据分析教材。本书配套课程“数据可视化”已上线中国大学MOOC,读者可在线学习。

    图书详情

    ISBN:9787121402777
    开 本:16(185*260)
    页 数:236
    字 数:374

    本书目录

    目    录
    第1章  数据分析软件简介	1
    1.1  数据分析软件简介	2
    1.2  Python语言介绍	3
    1.2.1  Python简介	3
    1.2.2  Python的功能	4
    1.2.3  Python编程环境	6
    1.3  Python数据分析平台	8
    1.3.1  Jupyter数据分析平台	9
    1.3.2  Python在线分析平台	15
    1.4  Python编程入门	20
    1.4.1  Python的工作目录	20
    1.4.2  Python的分析用包	20
    1.4.3  Python的数据类型	22
    习题1	26
    第2章  数据的收集与整理	28
    2.1  数据的类型	28
    2.1.1  按度量尺度分	28
    2.1.2  按时间状况分	29
    2.2  数据的收集	29
    2.2.1  横向数据的收集	30
    2.2.2  纵向数据的收集	32
    2.3  数据的管理	33
    2.3.1  表格管理数据	34
    2.3.2  数据库管理数据	34
    2.3.3  Python数据管理	34
    习题2	35
    第3章  Python数据分析编程基础	37
    3.1  Python编程运算	38
    3.1.1  基本运算	38
    3.1.2  控制语句	38
    3.1.3  函数定义	39
    3.1.4  面向对象	41
    3.2  数值分析库numpy	42
    3.2.1  一维数组	43
    3.2.2  二维数组	43
    3.2.3  数组的操作	43
    3.3  数据分析库pandas	44
    3.3.1  序列Series	44
    3.3.2  数据框DataFrame	46
    3.3.3  数据框的读写	48
    3.3.4  数据框的操作	50
    习题3	54
    第4章  数据的探索性分析及可视化	57
    4.1  数据的描述分析	58
    4.1.1  计数数据汇总分析	58
    4.1.2  计量数据汇总分析	59
    4.1.3  描述性汇总统计量	61
    4.2  数据的统计绘图	62
    4.2.1  基于matplotlib的绘图	62
    4.2.2  基于pandas的绘图	69
    4.3  数据的分组分析	73
    4.3.1  一维频数表与图	73
    4.3.2  二维集聚表与图	76
    4.3.3  多维透视表与图	79
    习题4	86
    第5章  数据的直观分析及可视化	88
    5.1  特殊统计图的绘制	89
    5.1.1  函数图	89
    5.1.2  气泡图	91
    5.1.3  三维散点图	91
    5.1.4  三维曲面图	92
    5.2  seaborn统计绘图	92
    5.2.1  seaborn绘图特点	93
    5.2.2  seaborn中的统计图	93
    5.3  ggplot绘图系统	98
    5.3.1  ggplot与plotnine包	98
    5.3.2  基于图层的绘图法	98
    5.3.3  plotnine中的统计图	100
    5.4  pyecharts动态绘图	104
    5.4.1  pyecharts简介	104
    5.4.2  pyecharts基本绘图	104
    5.4.3  基于数据框的绘图	110
    习题5	113
    第6章  数据的统计分析及可视化	115
    6.1  随机变量及其分布图	116
    6.1.1  均匀分布及随机数图	116
    6.1.2  正态分布及随机数图	117
    6.2  统计量及其抽样分布图	125
    6.2.1  统计量及抽样的概念	125
    6.2.2  统计量的分布及模拟图	126
    6.3  基本统计推断方法	129
    6.3.1  参数的估计方法	129
    6.3.2  参数的假设检验	132
    6.3.3  统计推断的可视化	133
    习题6	135
    第7章  数据的模型分析及可视化	137
    7.1  线性相关分析模型	138
    7.1.1  线性相关的概念和模拟	138
    7.1.2  样本相关系数的计算	140
    7.1.3  样本相关系数的检验	143
    7.2  线性回归分析模型	144
    7.2.1  线性回归模型的建立	144
    7.2.2  线性回归模型的检验	147
    7.2.3  线性回归模型的预测	149
    7.3  分组可视化模型分析	149
    7.3.1  可视化分组线性相关分析	150
    7.3.2  可视化分组线性回归模型	150
    习题7	153
    第8章  数据的预测分析及可视化	155
    8.1  动态数列的基本分析	156
    8.1.1  动态数列介绍	156
    8.1.2  动态数列的变动分析	158
    8.2  动态数列的预测分析	161
    8.2.1  趋势预测构建	161
    8.2.2  平滑预测方法	165
    8.3  时间序列数据的可视化分析	168
    8.3.1  股票数据可视化分析	169
    8.3.2  股票的收益率分析	176
    习题8	180
    第9章  数据的决策分析及可视化	182
    9.1  确定性决策分析	183
    9.1.1  单目标求解及图示	183
    9.1.2  多目标求解及图示	185
    9.2  不确定性决策分析	186
    9.2.1  分析方法的思想	186
    9.2.2  不确定性分析原则	187
    9.3  概率型风险分析	190
    9.3.1  期望值法及直观分析	191
    9.3.2  后悔期望值法及直观分析	192
    习题9	193
    第10章  数据的在线分析及可视化	195
    10.1  Tushare数据的可视化分析	196
    10.1.1  股市基本数据的获取与分析	196
    10.1.2  证券交易数据的获取与分析	203
    10.1.3  Tushare数据的保存及扩展	207
    10.2  新浪财经数据的可视化分析	208
    10.2.1  宏观经济数据的抓取与分析	209
    10.2.2  股票行情数据的抓取与分析	212
    10.3  中商情报数据的可视化分析	213
    10.3.1  宏观经济数据的爬取与分析	214
    10.3.2  A股股票信息的爬取与分析	216
    习题10	218
    附录A  本书学习博客	220
    附录B  书中相关资料	222
    附录C  书中自定义函数	223
    参考文献	224
    
    展开

    前     言

    “人生苦短,我要用Python”,这是网上对Python评价最多的一句话。目前我国许多地区高考都加入了Python编程的内容,更有甚者,一些中小学也开始开设Python编程课程,说明Python作为一种新兴的编程语言,已深入人心。Python在人工智能、大数据分析、自动化运维、全栈开发方面有着得天独厚的优势,有渐成编程语言主流之势,并以其简单和方便使用成为人工智能开发的首选语言。

    众所周知,数据分析是以数理统计为基础,应用统计学的基本原理和方法,结合计算机对实际资料和信息进行收集、整理和分析的一门科学。因此,它的原理较为抽象,对学生的数学基础要求也较高,教学中存在着大量的数学公式、数学符号、矩阵运算和统计计算,必须借助于现代化的计算工具和软件。

    本书重点介绍Python语言在处理数据、分析数据及数据可视化方面的应用技巧,内容涉及数据分析软件介绍、数据的收集与整理、Python数据分析编程基础、数据的探索性分析及可视化、数据的直观分析及可视化、数据的统计分析及可视化、数据的模型分析及可视化、数据的预测分析及可视化、数据的决策分析及可视化、数据的在线分析及可视化。

    全书内容共10章,其中第13章主要讲解数据分析的一些基础知识,重点介绍如何进行数据的收集、整理和分析,以及Python数据的处理和编程技巧;第47章主要讲解数据分析的一些常用数据分析方法,如数据的可视化、基本数据分析方法和模型分析;第810章介绍数据的一些简单预测决策方法,并给出了一些应用Python方法的数据在线分析案例。

    本书内容丰富,图文并茂,可操作性强且便于查阅,主要面向希望应用Python进行数据分析的读者,能有效地帮助读者提高数据处理与分析及可视化的水平,提升工作效率。本书适合各个层次的数据分析用户,既可作为初学者的入门指南,又可作为中、高级用户的参考手册,同时也可作为各大中专院校和培训班的数据分析教材。

    在方便读者学习和使用Python的数据分析技术方面,本书具有以下三大优点。

    (1)使用Python科学计算发行版Anaconda,方便数据分析者使用。

    该版本可从https://www.anaconda.com/下载安装并直接使用。

    (2)公开本书自编函数的源代码,使用者可以深入理解Python函数的编程技巧,用这些函数建立自己的开发包。本书建立了学习博客http://rstat.leanote.com,读者可从中了解数据分析的基本知识和常用数据分析软件的使用方法。

    (3)采用可视化教学平台:Python的基础版缺少一个面向一般人群的菜单界面,这对那些只想用其进行数据分析的使用者而言是一大困难,本书采用流行的Anaconda自带的分析平台Jupyter(Jupyter NotebookJupyter Lab)进行操作,该平台可作为数据分析教学软件使用,也可登录Jupyter云计算平台(https://jupyter.org/try)进行网上操作。

    本次修订是本书的第二次大的修改,主要扩展了四个方面的内容:

    (1)对全书内容进行了适当的调整,增加了大量数据可视化分析方面的内容。

    (2)每章增加了思维导图,方便读者学习和了解Python数据分析方法。

    (3)优化了部分章节的代码和操作,使用者可以进一步理解Python函数的编程技巧。

    (4)建立了本书的资源管理网站(https://gitee.com/Py-R/DaPy),书中的数据、代码、例子、习题、PPT等都可直接在网上下载使用。

    本书由王斌会、王术共同完成,其中第16章由王斌会撰写,第710章由王术撰写,王斌会负责全书的统稿。侯雅文、汪志红、谢贤芬、王志坚、李雄英、何志锋、颜斌、徐锋和梁焙婷等对书中内容进行了校对,在此深表谢意!

    本书在写作过程中得到广东恒电科技信息股份有限公司的大力支持,也得到暨南大学企业管理系的支持和鼓励,在此一并表示感谢!

    由于作者知识和水平有限,书中难免有错误和不足之处,欢迎读者批评指正!

     

                                                 202012月于暨南园  

    展开

    作者简介

    王斌会暨南大学管理学院教授,博士生导师。从事数学、统计学及经济管理教学和科研工作30多年,在数据科学和大数据分析领域做了大量的基础性研究与开创性工作。出版相关学术专著和教材10余本。精通大数据分析及SAS、SPSS、R、Python等语言的编程及数据处理云计算平台的开发。王术,博士生。英国伦敦大学国王学院数据科学硕士,现为中国农业科学院与比利时列日大学联合培养博士生。主要研究方向为农业大数据分析和挖掘、农业资源利用与区域规划。
  • 样 章 试 读
  • 图 书 评 价 我要评论
华信教育资源网