华信教育资源网
Python数据分析基础教程
丛   书   名: 数据科学与大数据技术系列
作   译   者:王斌会,王术 出 版 日 期:2018-10-01
出   版   社:电子工业出版社 维   护   人:秦淑灵 
书   代   号:G0339380 I S B N:9787121339387

图书简介:

      本书重点介绍Python语言数据处理与数据分析方面的应用技巧,内容涉及数据收集与整理、数据分析软件介绍、Python编程分析基础、数据的探索性分析、数据的可视化分析、数据的统计分析、数据的模型分析、数据的预测分析、数据的决策分析、数据的案例分析。本书内容丰富,图文并茂,可操作性强且便于查阅,主要面向希望应用Python进行数据分析的读者,能有效地帮助读者提高数据处理与分析的水平,提升工作效率。本书建立了学习博客(http://blog.leanote.com/DaPy),书中的例子数据和习题数据都可直接在该博客下载使用(也可在华信教育资源网http://www.hxedu.com.cn免费下载)。      本书适合各个层次的数据分析用户阅读,既可作为初学者的入门指南,又可作为中高级用户的参考手册,同时也可作为各大中专院校和培训班的数据分析教材。
您的专属联系人更多
配套资源 图书内容 样章/电子教材 图书评价
  • 配 套 资 源
    图书特别说明:所有代码和数据已迁移到以下两个网站中: Rstat.leanote.com(书中已有) gitee.com/Py-R(新加,永久免费使用)
     Python数据、幻灯和作业都有模板:
    《Python数据分析基础教程》:gitee.com/Py-R/DaPy
    《Python数据挖掘方法及应用》:gitee.com/Py-R/PyDm

    本书资源

    本书暂无资源

    会员上传本书资源

  • 图 书 内 容

    内容简介

          本书重点介绍Python语言数据处理与数据分析方面的应用技巧,内容涉及数据收集与整理、数据分析软件介绍、Python编程分析基础、数据的探索性分析、数据的可视化分析、数据的统计分析、数据的模型分析、数据的预测分析、数据的决策分析、数据的案例分析。本书内容丰富,图文并茂,可操作性强且便于查阅,主要面向希望应用Python进行数据分析的读者,能有效地帮助读者提高数据处理与分析的水平,提升工作效率。本书建立了学习博客(http://blog.leanote.com/DaPy),书中的例子数据和习题数据都可直接在该博客下载使用(也可在华信教育资源网http://www.hxedu.com.cn免费下载)。
          本书适合各个层次的数据分析用户阅读,既可作为初学者的入门指南,又可作为中高级用户的参考手册,同时也可作为各大中专院校和培训班的数据分析教材。

    图书详情

    ISBN:9787121339387
    开 本:16开
    页 数:192
    字 数:240.0

    本书目录

    目    录
    第1章  数据的收集与整理	1
    1.1  数据的类型	1
    1.1.1  按度量尺度分	1
    1.1.2  按时间状况分	1
    1.2  数据的收集	2
    1.2.1  横向数据的收集	2
    1.2.2  纵向数据的收集	6
    1.3  数据的管理	7
    1.3.1  表格管理数据	7
    1.3.2  数据库管理数据	8
    数据及练习	8
    第2章  数据分析软件介绍	10
    2.1  数据分析软件简介	10
    2.2  Python语言介绍	11
    2.2.1  Python简介	11
    2.2.2  Python的功能	12
    2.2.3  Python编程环境	14
    2.3  Python数据分析平台	17
    2.3.1  Jupyter数据分析平台	18
    2.3.2  Python在线分析平台	23
    2.4  Python编程入门	27
    2.4.1  Python的工作目录	27
    2.4.2  Python分析包(库)	27
    2.4.3  Python中的数据管理	29
    数据及练习	29
    第3章  Python编程分析基础	30
    3.1  Python数据类型	30
    3.1.1  Python对象	30
    3.1.2  数据的基本类型	31
    3.1.3  标准数据类型	33
    3.2  数值分析库numpy	34
    3.2.1  一维数组(向量)	34
    3.2.2  二维数组(矩阵)	35
    3.2.3  数组的操作	35
    3.3  数据分析库pandas	36
    3.3.1  序列(Series)	36
    3.3.2  数据框(DataFrame)	37
    3.3.3  数据框的读写	39
    3.3.4  数据框的操作	41
    3.4  Python编程运算	45
    3.4.1  基本运算	45
    3.4.2  控制语句	46
    3.4.3  函数定义	47
    3.4.4  面向对象	49
    数据及练习	50
    第4章  数据的探索性分析	52
    4.1  数据的描述分析	52
    4.1.1  基本描述统计量	52
    4.1.2  计数数据汇总分析	53
    4.1.3  计量数据汇总分析	53
    4.2  基本绘图命令	57
    4.2.1  常用的绘图函数	57
    4.2.2  基于pandas的绘图	66
    4.3  数据的分类分析	70
    4.3.1  一维频数分析	70
    4.3.2  二维集聚分析	73
    4.3.3  多维透视分析	77
    数据及练习	79
    第5章  数据的可视化分析	80
    5.1  特殊统计图的绘制	80
    5.1.1  数学函数图	80
    5.1.2  气泡图	82
    5.1.3  三维曲面图	82
    5.1.4  三维散点图	83
    5.2  seaborn统计绘图	83
    5.2.1  基本概念	84
    5.2.2  常用统计图	84
    5.3  ggplot绘图系统	88
    5.3.1  qplot快速制图	89
    5.3.2  ggplot基本绘图	90
    数据及练习	95
    第6章  数据的统计分析	97
    6.1  随机变量及其分布	97
    6.1.1  均匀分布	97
    6.1.2  正态分布	98
    6.2  数据分析统计基础	102
    6.2.1  统计量的概念	102
    6.2.2  统计量的分布	103
    6.3  基本统计推断方法	106
    6.3.1  参数的估计方法	107
    6.3.2  参数的假设检验	109
    数据及练习	111
    第7章  数据的模型分析	113
    7.1  简单线性相关模型	113
    7.1.1  线性相关的概念	113
    7.1.2  相关系数的计算	114
    7.1.3  相关系数的检验	115
    7.2  简单线性回归模型	116
    7.2.1  简单线性模型估计	116
    7.2.2  简单线性模型检验	118
    7.2.3  简单线性模型预测	119
    7.3  分组线性相关与回归	120
    7.3.1  分组线性相关分析	120
    7.3.2  分组线性回归模型	121
    数据及练习	122
    第8章  数据的预测分析	124
    8.1  动态数列的基本分析	124
    8.1.1  动态数列的介绍	124
    8.1.2  动态数列的分析	126
    8.2  动态数列预测分析	130
    8.2.1  趋势预测构建	130
    8.2.2  平滑预测法	134
    8.3  股票数据统计分析	138
    8.3.1  股票价格分析	139
    8.3.2  股票收益率分析	143
    数据及练习	147
    第9章  数据的决策分析	149
    9.1  确定性分析	149
    9.1.1  单目标求解	149
    9.1.2  多目标求解	150
    9.2  不确定性分析	151
    9.2.1  分析方法	151
    9.2.2  分析原则	152
    9.3  风险分析	154
    9.3.1  期望值法	154
    9.3.2  后悔期望值法	155
    数据及练习	155
    第10章  数据的案例分析	157
    10.1  在线数据获取与分析	157
    10.1.1  在线财经数据获取	157
    10.1.2  在线股票数据分析	159
    10.1.3  新股发行数据分析	161
    10.2  证券交易数据的分析	163
    10.2.1  历史行情数据分析	163
    10.2.2  实时行情数据分析	165
    10.2.3  大单交易数据分析	167
    10.2.4  公司盈利能力分析	168
    10.2.5  公司现金流量分析	169
    10.3  宏观经济数据的实证分析	170
    10.3.1  存款利率变动分析	170
    10.3.2  国内生产总值GDP分析	172
    10.3.3  工业品出厂价格指数分析	174
    10.4  电影票房数据的实时分析	175
    10.4.1  实时票房数据分析	175
    10.4.2  每日票房数据分析	176
    10.4.3  影院日度票房分析	177
    数据及练习	178
    附录A  本书的学习博客	179
    附录B  书中的例子数据	181
    附录C  书中的自定义函数	182
    参考文献	183
    展开

    前     言

          众所周知,数据分析是以数理统计为基础,运用统计学的基本原理和方法,结合计算机对实际资料和信息进行收集、整理和分析的一门科学。因此,它的原理较为抽象,对学生的数学基础要求也较高,教学中存在大量的数学公式、数学符号、矩阵运算和统计计算,必须借助于现代化的计算工具。
         “人生苦短,我要用Python”,这是网上对Python评价最多的一句话。目前我国许多地区的高考试卷中都加入了Python编程的内容,更有甚者,一些中小学也开始开设Python编程课程,说明Python作为一种新兴的编程语言,已深入人心。
          本书重点介绍Python语言数据处理与数据分析方面的应用技巧,内容涉及数据收集与整理、数据分析软件介绍、Python编程分析基础、数据的探索性分析、数据的可视化分析、数据的统计分析、数据的模型分析、数据的预测分析、数据的决策分析、数据的案例分析等数据分析方面的内容。
          全书共10章内容,其中第1~3章主要讲解数据分析的一些基础知识,重点介绍如何进行数据的收集、整理和分析,以及Python数据的处理和编程技巧;第4~7章主要讲解数据分析的一些常用数据分析方法,如数据的可视化、基本数据分析方法和模型分析;第8~10章介绍数据的一些简单预测决策方法,并给出了一些应用Python方法的数据分析案例。
          本书内容丰富,图文并茂,可操作性强且便于查阅,主要面向希望应用Python进行数据分析的读者,能有效地帮助读者提高数据处理与分析的水平,提升工作效率。本书适合各层次的数据分析用户阅读,既可作为初学者的入门指南,又可作为中高级用户的参考手册,同时也可作为各大中专院校和培训班的数据分析教材。
          为方便读者学习和使用Python的数据分析技术,本书具有三大优点。
         (1)使用Python科学计算发行版Anaconda,方便数据分析者使用。
    该版本可从https://www.anaconda.com/下载安装并直接使用。
         (2)公开本书自定义函数的源代码,使用者可以深入理解Python函数的编程技巧,用这些函数建立自己的开发包;并建立了本书的学习博客(http://blog.leanote.com/DaPy),书中的数据、代码、例子、习题都可从该报告下载并直接使用(也可以在华信教育资源网http://www.hxedu.com.cn免费下载)。
         (3)采用网络化教学平台:Python的基础版缺少一个面向一般人群的菜单界面,这对那些只想用其进行数据分析的使用者而言是一大困难,本书采用流行的Python网络分析平台  Jupyter(https://jupyter.org/try),该平台可作为数据分析教学软件使用。
          书中软件输出的坐标图多数没有标出横、纵坐标的量,目的是与软件界面保持一致。
          本书由王斌会、王术共同完成,其中第1~6章由王斌会撰写,第7~10章由王术撰写,王斌会负责全书统稿。侯雅文、何志峰、颜斌、徐锋和刘霞等进行了校对,在此深表谢意!
          本书在写作过程中得到了广东时汇信息科技有限公司的大力支持,并使用了其公司提供的蜜蜂实训平台,为实战操作提供了可靠的应用环境,同时公司协调云计算工程师周剑辉、周政江等对实验步骤进行了详细的验证,在此表示衷心感谢!
          由于作者知识和水平有限,书中难免有错误和不足之处,欢迎读者批评指正!

    编著者      
    2018年8月于暨南园

    展开

    作者简介

    本书暂无作者简介
  • 样 章 试 读
  • 图 书 评 价 我要评论
华信教育资源网