1662 年 - 至今 | 格朗特·贝叶斯·高斯·皮尔逊·费希尔·图基 | 从政治算术到数据科学的不确定性科学
| 阶段 | 时间 | 特点 | 代表 |
|---|---|---|---|
| 描述统计 | 1662-1800 年 | 人口统计、数据描述 | 格朗特、配第 |
| 概率统计 | 1800-1900 年 | 概率论、正态分布 | 高斯、拉普拉斯 |
| 推断统计 | 1900-1950 年 | 假设检验、实验设计 | 皮尔逊、费希尔 |
| 现代统计 | 1950 年 - 至今 | 计算统计、数据科学 | 图基、机器学习 |
统计学研究领域
定义:研究对象全体与部分
意义:统计推断基础
应用:抽样调查
定义:统计推断方法
意义:科学验证核心
应用:科学研究
定义:最常见概率分布
意义:统计理论基石
应用:质量控制
定义:变量关系分析
意义:预测与解释
应用:数据分析
| 理论 | 提出者 | 时间 | 核心内容 |
|---|---|---|---|
| 贝叶斯定理 | 贝叶斯 | 1763 | 条件概率更新 |
| 正态分布 | 高斯 | 1809 | 误差分布规律 |
| 大数定律 | 伯努利等 | 1713-1900s | 样本均值收敛 |
| 中心极限定理 | 拉普拉斯等 | 1810-1900s | 样本均值正态性 |
| 假设检验 | 皮尔逊、费希尔 | 1900-1930s | 统计推断框架 |
格朗特发表《死亡表的自然和政治观察》,分析伦敦死亡数据,标志统计学萌芽
伯努利发表《推测术》,证明大数定律,奠定概率论基础
贝叶斯遗作发表,提出贝叶斯定理,奠定贝叶斯统计基础
高斯提出正态分布和最小二乘法,奠定统计推断基础
高尔顿提出相关与回归概念,开创变量关系研究
皮尔逊提出卡方检验,开创假设检验先河
戈塞特提出 t 分布,解决小样本推断问题
费希尔创立实验设计和方差分析,革命性改变科学研究
柯尔莫哥洛夫建立概率论公理体系,奠定现代概率论基础
计算机应用于统计计算,SPSS 等软件出现
图基提出探索性数据分析,强调数据可视化
埃弗龙发明自助法,革命性改变统计推断
统计学习与机器学习融合,支持向量机等兴起
大数据时代到来,统计方法应对海量数据
深度学习兴起,统计学与人工智能深度融合
内容:实验设计、数据分析
意义:科学验证
应用:所有科学
内容:临床试验、流行病学
意义:医疗决策
应用:药物研发
内容:市场分析、质量控制
意义:商业成功
应用:企业管理
内容:人口普查、经济统计
意义:政策制定
应用:公共政策
| 影响领域 | 说明 | 例子 |
|---|---|---|
| 自然科学 | 实验数据分析 | 物理、化学实验 |
| 医学 | 临床试验设计 | 药物有效性检验 |
| 社会科学 | 调查研究方法 | 社会调查分析 |
| 经济学 | 计量经济学 | 经济模型估计 |
| 计算机科学 | 机器学习基础 | 算法性能评估 |
"统计是科学的语法"
"统计学是科学的方法论"
"统计学是数据时代的通用语言"
| 方向 | 内容 | 目标 |
|---|---|---|
| 高维统计 | 高维数据分析 | 应对大数据挑战 |
| 因果推断 | 因果关系识别 | 超越相关分析 |
| 贝叶斯计算 | MCMC、变分推断 | 复杂模型推断 |
| 统计机器学习 | 统计与 ML 融合 | 提高预测能力 |
| 可重复性研究 | 研究可重复性 | 提高科学质量 |