高等院校研究生用书:复杂数据统计方法:基于R的应用.pdf

高等院校研究生用书:复杂数据统计方法:基于R的应用.pdf
 

书籍描述

编辑推荐
《复杂数据统计方法——基于R的应用》由吴喜之编著,本书首先通过一些简单的统计和数学内容介绍R软件的基本知识,然后介绍数据分析的一些基本逻辑和常识。本书的主体则是根据不同数据形式介绍相应的方法。本书以数据为主导,各章都是完全独立的。有一些统计基本知识的读者可以选读本书的任何一个完整的部分。虽然本书介绍的方法涉及应用统计的各个方面,但不可能介绍所有的数学和统计细节,否则将会是一部巨型的百科全书。笔者尽量用文字和少量数学公式对各种方法的原理予以直观介绍,并且引导读者做进一步的阅读。

作者简介
吴喜之,北京大学数学力学系本科,美国北卡罗来纳大学统计博士。中国人民大学统计学院教授,博士生导师。曾在美国加利福尼亚大学、美国北卡罗来纳大学、南开大学、中国人民大学、北京大学等多所著名学府执教。

目录
第1章 引言
1.1 作为科学的统计
1.2 数据分析的实践
1.3 数据的形式以及可能用到的模型
1.3.1 横截面数据:因变量为实轴上的数量变量
1.3.2 横截面数据:因变量为分类(定性)变量或者频数
1.3.3 纵向数据,多水平数据,面板数据,重复观测数据
1.3.4 多元数据各变量之间的关系:多元分析
1.3.5 路径模型结构方程模型
1.3.6 多元时间序列数据
1.4 r软件入门
1.4.1 简介
1.4.2 动手
第2章 横截面数据:因变量为实数轴上的数量变量
2.1 简单回归回顾
2.2 简单线性模型不易处理的横截面数据
2.2.1 标准线性回归中的指数变换
2.2.2 生存分析数据的cox回归模型
2.2.3 数据出现多重共线性情况:岭回归,lasso回归,适应性lasso回归,偏最小二乘回归
2.2.4 无法做任何假定的数据:机器学习回归方法
2.2.5 决策树回归(回归树)
2.2.6 boosting回归
2.2.7 bagging回归
2.2.8 随机森林回归
2.2.9 人工神经网络回归
2.2.10 支持向量机回归
2.2.11 几种回归方法五折交叉验证结果
2.2.12 方法的稳定性及过拟合
第3章 横截面数据:因变量为分类变量及因变量为频数(计数)变量的情况
3.1 经典logistic回归,probit回归和仅适用于数量自变量的判别分析回顾
3.1.1 logistic回归和probit回归
3.1.2 经典判别分析
3.2 因变量为分类变量,自变量含有分类变量:机器学习分类方法
3.2.1 决策树分类(分类树)
3.2.2 adaboost分类
3.2.3 bagging分类
3.2.4 随机森林分类
3.2.5 支持向量机分类
3.2.6 最近邻方法分类
3.2.7 分类方法五折交叉验证结果
3.3 因变量为频数(计数)的情况
3.3.1 经典的poisson对数线性模型回顾
3.3.2 使用poisson对数线性模型时的散布问题
3.3.3 零膨胀计数数据的poisson回归
3.3.4 使用机器学习的算法模型拟合计数数据
3.3.5 多项logit模型及多项分布对数线性模型回顾
第4章 纵向数据(多水平数据,面板数据)
4.1 纵向数据:线性随机效应混合模型
4.2 纵向数据:广义线性随机效应混合模型
4.3 纵向数据:决策树及随机效应模型
4.4 纵向数据:纵向生存数据
4.4.1 cox随机效应混合模型
4.4.2 分步联合建模
4.5 计量经济学家的视角:面板数据
第5章 多元分析(不区分因变量及自变量)
5.1 实数轴上的数据:经典多元分析内容回顾
5.1.1 主成分分析及因子分析
5.1.2 分层聚类及k均值聚类
5.1.3 典型相关分析
5.1.4 对应分析
5.2 非经典多元数据分析:可视化
5.2.1 主成分分析
5.2.2 对应分析
5.2.3 多重对应分析
5.2.4 多重因子分析
5.2.5 分层多重因子分析
5.2.6 基于主成分分析的聚类
5.3 多元数据的关联规则分析
第6章 路径建模(结构方程建模)数据的pls分析
6.1 路径模型概述
6.1.1 路径模型
6.1.2 路径模型的两种主要方法
6.2 pls方法:顾客满意度的例子
6.3 协方差方法简介
6.4 结构方程模型的一些问题
第7章 多元时间序列数据
7.1 时间序列的基本概念及单变量时间序列方法回顾
7.1.1 时间序列的一些定义和基本概念
7.1.2 常用的一元时间序列方法
7.2 单位根及协整检验
7.2.1 概述
7.2.2 单位根检验
7.2.3 协整检验
7.3 varx模型与状态空间模型
7.3.1 varx模型拟合
7.3.2 状态空间模型拟合
7.3.3 模型的比较和预测
附录 练习:熟练使用r软件
参考文献

内容简介
《复杂数据统计方法——基于R的应用》由吴喜之编著,用自由的日软件分析30多个可以从国外网站下载的真实数据,包括横截面数据、纵向数据和时间序列数据,通过这些数据介绍了几乎所有经典方法及最新的机器学习方法。
《复杂数据统计方法——基于R的应用》特点:(1)以数据为导向;(2)介绍最新的方法(附有传统方法回顾);(3)提供R软件入门及全部例子计算的日代码及数据的网址;(4)各章独立。
《复杂数据统计方法——基于R的应用》的读者对象包括统计学、应用统计学、经济学、数学、应用数学、精算、环境、计量经济学、生物医学等专业的本科、硕士及博士生,各领域的教师和实际工作者。

购买书籍

当当网购书 京东购书 卓越购书

PDF电子书下载地址

相关书籍

搜索更多