图书简介:
目 录
第1章 应确保数据是值得分析的
1.1 什么是数据和/或统计资料
1.1.1 数据不等于统计资料
1.1.2 统计资料的要素
1.2 确保数据值得分析的第一道关—制订科学完善的课题设计方案
1.2.1 什么叫科学研究
1.2.2 科学研究与课题之间是什么关系
1.2.3 做课题之前为什么要制订课题设计方案
1.2.4 课题设计方案有哪些种类
1.2.5 科学完善的科研设计方案的标志
1.3 确保数据值得分析的第二道关-实时进行严格的过程质量控制
1.3.1 必须严格控制课题实施过程中的质量
1.3.2 进行质量控制的必要性
1.3.3 进行质量控制的环节与措施
1.4 确保数据值得分析的第三道关-确保数据的原始性没有被破坏
1.4.1 应有切实可行的措施确保收集的数据具有原始性
1.4.2 与常见试验设计类型对应的规格化统计表
1.5 常见不值得分析的数据种类
1.5.1 人为编造的数据是不值得分析的
1.5.2 产生于质量控制不严的数据是不值得分析的
1.5.3 经过错误的方法加工整理后的数据是不值得分析的
1.5.4 不符合特定统计分析方法要求的数据是不值得分析的
1.5.5 盲目解释基于误用统计分析方法所得到的分析结果是不可取的
1.5.6 缺失值过多的数据是不值得分析的
1.6 本章小结
第2章 绘制统计图
2.1 问题、 数据及统计描述方法的选择
2.1.1 问题与数据
2.1.2 对数据结构的分析
2.1.3 分析目的与统计描述方法的选择
2.1.4 统计图概述
2.2 绘制单式条图
2.2.1 程序及说明
2.2.2 输出单式条图
2.3 绘制复式条图
2.3.1 程序及说明
2.3.2 输出复式条图
2.4 绘制百分条图
2.4.1 程序及说明
2.4.2 输出百分条图
2.5 绘制圆图
2.5.1 程序及说明
2.5.2 输出圆图
2.6 绘制箱式图
2.6.1 程序及说明
2.6.2 输出箱式图
2.7 绘制直方图
2.7.1 程序及说明
2.7.2 输出直方图
2.8 绘制散点图
2.8.1 程序及说明
2.8.2 输出散点图
2.9 绘制普通线图
2.9.1 程序及说明
2.9.2 输出普通线图
2.10 绘制半对数线图
2.10.1 程序及说明
2.10.2 输出半对数线图
2.11 绘制P-P图和Q-Q图
2.11.1 程序及说明
2.11.2 输出P-P图
2.12 本章小结
第3章 统计分析方法的分类与合理选用的关键技术
3.1 统计分析方法的分类
3.1.1 概述
3.1.2 描述性统计分析
3.1.3 探索性统计分析
3.1.4 广义差异性统计分析
3.1.5 相关与回归分析
3.1.6 广义综合评价
3.2 合理选用统计分析方法的关键技术
3.2.1 合理选用统计分析方法的四要素
3.2.2 合理选用统计分析方法的实例演示
3.3 面对实际问题合理选用统计分析方法的要领
3.3.1 描述性统计分析
3.3.2 探索性统计分析
3.3.3 传统差异性统计分析
3.3.4 相关分析
3.3.5 回归分析
3.3.6 广义综合评价
3.4 本章小结
第4章 结合分析
4.1 问题与数据结构
4.1.1 实例
4.1.2 对数据结构的分析
4.1.3 统计分析目的与分析方法的选择
4.2 结合分析内容简介
4.2.1 基本概念
4.2.2 基本原理
4.3 结合分析的应用
4.3.1 用SAS分析问题4-1中的资料
4.3.2 用SAS分析问题4-2中的资料
4.4 本章小结
第5章 路径分析
5.1.2 对数据结构的分析
5.1.3 分析目的与统计分析方法的选择
5.2 路径分析内容简介
5.2.1 路径分析概述
5.2.2 适合进行路径分析的数据结构
5.2.3 路径分析的基本概念
5.2.4 路径分析的基本原理
5.2.5 路径分析的步骤
5.3 路径分析的应用
5.3.1 用REG过程实现路径分析
5.3.2 用CALIS过程实现路径分析
5.3.3 如何处理非同质资料的思考
5.4.3 用逐步多重线性回归分析方法分析例5-2资料
5.4 本章小结
第6章 主成分分析
6.1 问题与数据结构
6.1.1 实例
6.1.2 对数据结构的分析
6.1.3 分析目的与统计分析方法的选择
6.2 主成分分析内容简介
6.2.1 主成分分析概述
6.2.2 主成分分析的基本原理
6.2.3 主成分的计算步骤及性质
6.2.4 与主成分分析有关的其他内容
6.2.5 PRINCOMP过程简介
6.3 主成分分析的应用
6.3.1 SAS程序
6.3.2 主要分析结果及解释
6.4 本章小结
第7章 变量聚类分析
7.1 问题与数据结构
7.1.1 实例
7.1.2 对数据结构的分析
7.1.3 分析目的与统计分析方法的选择
7.2 变量聚类分析内容简介
7.2.1 变量聚类分析的概念
7.2.2 变量聚类分析的聚类统计量
7.2.3 适合进行变量聚类分析的数据结构
7.2.4 VARCLUS过程简介
7.3 变量聚类分析的应用
7.3.1 SAS程序
7.3.2 主要分析结果及解释
7.4 本章小结
第8章 典型相关分析
8.1 问题与数据结构
8.1.1 实例
8.1.2 对数据结构的分析
8.1.3 分析目的与统计分析方法的选择
8.2 典型相关分析内容简介
8.2.1 典型相关分析概述
8.2.2 适合进行典型相关分析的数据结构
8.2.3 典型相关变量和典型相关系数的定义及解法
8.2.4 典型相关系数的假设检验
8.2.5 典型冗余分析
8.2.6 CANCORR过程简介
8.3 典型相关分析的应用
8.3.1 SAS程序
8.3.2 主要分析结果及解释
8.4 本章小结
第9章 多元多重线性回归分析
9.1 问题与数据结构
9.1.1 实例
9.1.2 对数据结构的分析
9.1.3 统计分析目的与统计分分析方法的选择
9.2 多元多重线性回归分析内容简介
9.2.1 基于普通最小二法筛选自变量的思路
9.2.2 何为偏最小二乘回归分析
9.2.3 偏最小二乘回归分析的基本原理与步骤
9.3 偏最小二乘回归分析的应用
9.3.1 问题与数据结构
9.3.2 用两种检验方法来决定抽取几对主成分变量
9.3 如何获得较多统计量的计算结果
9.4 本章小结
第10章 探索性因子分析
10.1 问题与数据结构
10.1.1 实例
10.1.2 对数据结构的分析
10.1.3 分析目的与统计分析方法的选择
10.2 探索性因子分析内容简介
10.2.1 概述
10.2.2 探索性因子分析的数学模型
10.2.3 探索性因子分析中载荷矩阵A的统计意义
10.2.4 因子载荷矩阵A的估计方法
10.2.5 公因子个数的确定方法
10.2.6 因子旋转
10.2.7 因子得分
10.2.8 FACTOR过程简介
10.3 探索性因子分析的应用
10.3.1 SAS程序
10.3.2 主要分析结果及解释
10.4 本章小结
第11章 证实性因子分析
11.1 问题与数据结构
11.1.1 实例
11.1.2 对数据结构的分析
11.1.3 分析目的与统计分析方法的选择
11.2 证实性因子分析简介
11.2.1 概述
11.2.2 CALIS过程简介
11.3 证实性因子分析的应用
11.3.1 SAS程序
11.3.2 主要分析结果及解释
11.4 本章小结
第12章 结构方程模型分析
12.1 问题与数据结构
12.1.1 实例
12.1.2 对数据结构的分析
12.1.3 分析目的与统计分析方法的选择
12.2 结构方程模型简介
12.2.1 概述
12.2.2 基本原理
12.3 结构方程模型分析的应用
12.3.1 SAS程序
12.3.2 主要分析结果及解释
12.4 本章小结
第13章 传统综合评价
13.1 问题与数据结构
13.1.1 实例
13.1.2 对数据结构的分析
13.1.3 分析目的与统计分析方法的选择
13.2 传统综合评价方法内容介绍
13.2.1 综合评分法
13.2.2 Topsis法
13.2.3 层次分析法
13.2.4 RSR综合评价法
13.3 传统综合评价方法的应用
13.3.1 用综合评分法对例13-1资料进行综合评价
13.3.2 用Topsis法对例13-2数据进行综合评价
13.3.3 用层次分析法对例13-3数据进行综合评价
13.3.4 用RSR综合评价法对例13-4数据进行综合评价
13.4 本章小结
第14章 无序样品聚类分析
14.1 问题与数据结构
14.1.1 实例
14.1.2 对数据结构的分析
14.1.3 分析目的与统计分析方法的选择
14.2 无序样品聚类分析简介
14.2.1 概述
14.2.2 无序样品聚类分析方法分类
14.2.3 类的特征与个数的确定
14.2.4 无序样品聚类分析的计算原理
14.2.5 CLUSTER过程等简介
14.3 无序样品聚类分析的应用
14.3.1 SAS程序
14.3.2 主要分析结果及解释
14.5 本章小结
第15章 有序样品聚类分析
15.1 问题与数据结构
15.1.1 实例
15.1.2 对数据结构的分析
15.1.3 分析目的与统计分析方法的选择
15.2 有序样品聚类分析内容简介
15.2.1 概述
15.2.2 有序样品聚类分析的基本概念
15.2.3 有序样品聚类分析的计算原理
15.3 有序样品聚类分析的应用
15.3.1 SAS程序
15.3.2 主要分析结果及解释
15.4 本章小结
第16章 多维尺度分析
16.1 问题与数据结构
16.1.1 实例
16.1.2 对数据结构的分析
16.1.3 分析目的与统计分析方法的选择
16.2 多维尺度分析内容简介
16.2.1 概述
16.2.2 度量型多维尺度分析的计算原理
16.2.3 非度量型多维尺度分析的计算原理
16.3 多维尺度分析的应用
16.3.1 SAS程序
16.3.2 主要分析结果及解释
16.4 MDS过程简介
16.5 本章小结
第17章 定量资料对应分析
17.1 问题与数据结构
17.1.1 实例
17.1.2 对数据结构的分析
17.1.3 分析目的与统计分析方法的选择
17.2 定量资料对应分析简介
17.2.1 概述
17.2.2 定量资料对应分析的基本原理
17.2.3 定量资料对应分析的实施步骤
17.3 定量资料对应分析的应用
17.3.1 SAS程序
17.3.2 主要分析结果及解释
17.4 本章小结
第18章 定性资料对应分析
18.1 问题与数据结构
18.1.1 实例
18.1.2 对数据结构的分析
18.1.3 分析目的与统计分析方法的选择
18.2 定性资料对应分析内容简介
18.3 定性资料对应分析的应用
18.3.1 SAS程序
18.3.2 主要分析结果及解释
18.3 本章小结
第19章 Shannon信息量分析
19.1 问题与数据结构
19.1.1 实例
19.1.2 对数据结构的分析
19.1.3 统计分析目的与分析方法的选择
19.2 Shannon信息量分析内容简介
19.2.1 概述
19.2.2 Shannon信息量分析的基本原理
19.3 Shannon信息量分析的应用
19.3.1 对问题19-1资料进行Shannon信息量分析
19.3.2 对问题19-2资料进行Shannon信息量分析
19.4 本章小结
第20章 决策树分析
20.1 决策树简介
20.2 决策树的基本原理
20.3 决策树种类及决策树构造思路
20.4 递归分割的分裂准则
20.5 变量重要性检测
20.6 实际应用与结果解释
20.7 用数据挖掘模块近似实现各种决策树算法
20.8 本章小结
第21章 神经网络分析
21.1 前馈型神经网络简介
21.2 多层感知器的学习
21.3 模型过拟合
21.4 模型复杂性的评价
21.4.1 模型泛化能力(Generalization)的评价
21.4.2 模型选择的标准
21.5 实际应用与结果解释
21.6 本章小结
第22章 数据挖掘与分析
22.1 数据挖掘的基本概念
22.1.1 数据挖掘的背景
22.1.2 数据挖掘的基本概念
22.1.3 数据挖掘任务的分类
22.1.4 数据挖掘的应用
22.2 SAS企业数据挖掘器介绍
22.3 关联规则与序列规则
22.3.1 关联规则分析
22.3.2 关联规则挖掘实例分析
22.3.3 序列规则分析
22.3.4 序列规则挖掘实例分析
22.4 分类预测
22.4.1 数据准备
22.4.2 数据探索与数据转换
22.4.3 构造预测模型
22.4.4 模型评估与数据预测
22.5 本章小结
第23章 基因表达谱分析
23.1 基因表达谱的概念
23.2 基因表达谱的数据获取及标准化
23.2.1 基因表达谱的数据获取
23.2.2 基因表达数据的标准化
23.3 基因表达数据分析技术
23.3.1 差异表达基因的筛选
23.3.2 基因表达的聚类分析方法
23.4 基因调控网络分析
23.5 本章小结
第24章 生物信息分析
24.1 生物信息学定义
24.1.1 生物学问题
24.1.2 生物数据
24.1.3 计算工具
24.2 统计学在生物信息学中的应用
24.2.1 基于基因表达谱的样本分型研究
24.2.2 基于基因表达谱的样本分类研究
24.3 本章小结
第25章 用SAS实现遗传资料统计分析
25.1 SAS/Genetics简介
25.2 ALLELE、 HAPLOTYPE和HTSNP过程简介
25.2.1 数据格式
25.2.2 ALLELE过程的语法结构
25.2.3 HAPLOTYPE过程的语法结构
25.2.4 HTSNP过程的语法结构及其应用
25.3 利用CASECONTROL和FAMILY进行关联分析
25.3.1 CASECONTROL过程的语法结构
25.3.2 FAMILY过程的语法结构及其应用
25.4 亲缘系数和近交系数
25.5 结果校正和图形输出
25.5.1 平滑处理和多重检验校正
25.5.2 PSMOOTH过程的语法结构及其应用
25.5.3 %TPLOT宏及其应用
25.6 本章小结
第26章 遗传流行病学资料的统计分析
26.1 基因、 基因型频率测定与Hardy-Weinberg平衡定律的验证
26.1.1 问题与数据
26.1.2 SAS程序中重要内容的说明
26.1.3 主要分析结果及解释
26.2 连锁不平衡与单体型分析
26.2.1 问题与数据
26.2.2 SAS程序中重要内容的说明
26.2.3 主要分析结果及解释
26.3 多位点基因型与疾病关联分析
26.3.1 问题与数据
26.3.2 SAS程序中重要内容的说明
26.3.3 主要分析结果及解释
26.4 标签SNP的确认与SAS程序
26.4.1 问题与数据
26.4.2 SAS程序中重要内容的说明
26.4.3 主要分析结果及解释
26.5 一般人群病例对照遗传资料的关联分析
26.5.1 问题与数据
26.5.2 SAS程序中重要内容的说明
26.5.3 主要分析结果及解释
26.6 家系数据的关联分析
26.6.1 问题与数据
26.6.2 SAS程序中重要内容的说明
26.6.3 主要分析结果及解释
26.7 本章小结
附录 胡良平统计学专著及配套软件简介
展开
《SAS统计分析教程》前言
众所周知, 统计学内容非常丰富, 学习和正确使用它难度很大; SAS软件功能非常强大, 实用面极宽, SAS语言又十分繁杂, 学习和全面掌握其用法并非易事; 显然, 实际工作者要想在较短的时间内, 学会用SAS软件方便快捷且正确地解决各种实验设计、 统计表达与描述、 常见和多元统计分析、 现代回归分析、 数据挖掘和基因表达谱分析等问题, 几乎是天方夜谭, 然而, 本书却使其成为现实!
笔者有何灵丹妙计呢?“面向问题”的思维模式和写作手法是解决复杂问题、 并使其化繁为简、 实用方便的“锦囊妙计”。本书各章针对拟解决的每个具体问题, 首先给出“问题、 数据和统计分析方法的选择”, 接着, 用编制好的SAS程序分析给定的资料, 并给出程序修改指导、 主要输出结果及其解释。为了降低书的出版费用, 笔者千方百计对书稿进行精简, 使以纸质印刷的篇幅约为原稿的三分之一, 而原稿中三分之二的内容以附录的形式放在与本书配套的光盘上。本书正文内容共分8篇47章。第1篇 对定量结果进行差异性分析; 第2篇 对定性结果进行差异性分析; 第3篇 对定量结果进行预测性分析; 第4篇 对定性结果进行预测性分析; 第5篇 多变量间相互与依赖关系分析; 第6篇 变量或样品间亲疏关系或近似程度分析; 第7篇 数据挖掘技术与基因表达谱分析简介; 第8篇 用编程法绘制统计图与实现实验设计。各章末尾均注明参编者详细名单。值得一提的是: 本书中的所有计算基于SAS 9.2版本, 少量SAS过程(特别是涉及SAS/Genetics模块)在SAS 9.2以前的环境下不能正常运行。
与本书配套光盘上的内容有: 附录1与SAS语言有关的内容简介, 包括第48章 SAS语句简介、 第49章 SAS过程简介、 第50章 SAS函数简介、 第51章 SAS宏简介、 第52章 SAS ODS简介、 第53章 SAS SQL简介、 第54章 SAS数组简介和第55章 SAS/IML简介; 附录2四个非编程模块简介, 包括第56章 SAS/ASSIST模块用法简介、 第57章 SAS/ANALYST模块用法简介、 第58章 SAS/INSIGHT模块用法简介和第59章 SAS/ADX模块用法简介; 附录3数据挖掘技术与基因表达谱分析, 包括第60章 数据挖掘的概念及常用统计分析技术、 第61章 基因表达谱的概念及数据分析技术和第62章 生物信息学; 附录4 各章实例和数据; 附录5 各章SAS程序; 附录6 各章SAS输出结果; 附录7 各章计算原理和计算公式; 附录8 各章参考文献和附录9胡良平统计学专著与配套软件简介。
在本书即将出版之际, 笔者真挚地感谢为本书作出过突出贡献的来自全国十多所高等院校的教授、 副教授和青年学者, 如山西医科大学张岩波、 余红梅和郭东星教授、 中山医科大学张晋昕教授、 武汉大学毛宗福教授、 哈尔滨医科大学李霞和张瑞杰教授、 第三军医大学易东教授、 首都医科大学郭秀花教授、 北京大学医学部曹波副教授、 北京邮电大学张晓航副教授等; 还要感谢所有为本书付出过辛勤劳动的人们, 他们的名字被写在本书的编委名单之中。特别是高辉、 柳伟伟、 周诗国、 郭晋为本书的审阅工作付出了大量细致而又卓有成效的劳动, 而本室2009级四名硕士研究生(鲍晓蕾、 贾元杰、 关雪、 梦冰)也为本书的校对作出了很多贡献。正是由于他们的积极参与、 不懈努力和真心奉献, 才使这部历时四年的专著能够问世!
由于笔者水平有限, 书中难免会出现这样或那样的不妥, 甚至错误之处, 恳请广大读者不吝赐教, 以便再版时修正。
主编 胡良平
于北京军事医学科学院
生物医学统计学咨询中心
2010年01月14日
《SAS高级统计分析教程(第2版)》前言
自从《SAS统计分析教程》于2010年6月由电子工业出版社正式出版后的2~3年间, 此书经受住了市场的考验, 得到了广大读者的褒奖、 支持和鼓励; 大约在2013年下半年, 因市场上脱销了此书, 故出版社征求笔者意见后, 重印了数千册。最近笔者主讲全国统计学培训班期间, 听见部分学员说此书在全国各大网店上缺货了。然而, 可能出现脱销现象, 在2014年底, 负责此书出版的编辑早就预见到了, 并敦促笔者抓紧时间修订。因为SAS软件内容更新很快, 第1版主要基于SAS 6.1.3版本, 而现在, SAS 9.2和SAS 9.3版本较之前增添了许多新功能。另外, 此书第1版出版后, 在使用过程中也发现了个别不妥和疏漏之处, 有必要对第1版中的差错之处进行纠正; 同时, 有必要结合SAS软件的特点和实际使用统计学的需求, 对全书内容和布局进行必要的修改、 补充和调整。
由于增加的新内容比较多, 使整本书的篇幅大大超过了原书, 故负责本书的编辑提出了一个大胆的方案, 将第2版改为两本印刷出版, 书名分别为: 《SAS常用统计分析教程(第2版)》与《SAS高级统计分析教程(第2版)》, 本书是后者。
本书的核心内容是现代多元统计分析(不包括多元方差和协方差分析、 判别分析, 这些内容已被收录入《SAS常用统计分析教程(第2版)》之中), 其内容散布在三篇共15章之中, 分别冠以篇名“变量间相互与依赖关系分析”、 “样品间优劣亲疏或相对位置分析”和“样品与变量或原因与结果之间的关联性分析”, 使条理更加清楚, 便于读者学习和使用。
为了适应科学技术的发展对统计学提出的需求, 书中保留了数据挖掘、 生物信息学和遗传资料统计分析这三大领域方面的知识和技术, 有利于开拓读者思路和激发其对统计学更广泛的兴趣。
在本书即将出版之际, 笔者情不自禁地要提及: 本室2013和2014级硕士研究生刘一松、 胡完和郭春雪, 他们对全书做了认真的校对; 最后, 请允许笔者感谢直接和间接为此书第1版和第2版付出过辛勤劳动的所有同志和朋友!
由于笔者水平有限, 书中难免会出现这样或那样的不妥, 甚至错误之处, 恳请广大读者不吝赐教, 以便再版时修正。为便于与读者沟通和交流, 特将笔者邮箱地址和有关网址呈现在此: LPHU812@SINA.COM; WWW.STATWD.COM; WWW.Huasitai.com。
主编 胡良平
于北京军事医学科学院
2015年08月10日
展开