17 世纪 - 至今 | 数据收集·概率论·推断统计 | 从数据中发现真理的科学
| 分支 | 研究内容 | 核心方法 | 应用 |
|---|---|---|---|
| 描述统计 | 数据整理、展示、概括 | 平均数、标准差、图表 | 数据报告、可视化 |
| 推断统计 | 从样本推断总体 | 假设检验、置信区间 | 科学研究、决策 |
统计学基本公式
总体:研究对象的全体
样本:从总体中抽取的部分
意义:用样本推断总体
参数:总体特征值(μ, σ)
统计量:样本特征值(x̄, s)
意义:用统计量估计参数
原假设:H₀(无效应)
备择假设:H₁(有效应)
P 值:拒绝原假设的概率
定义:参数的可能取值范围
置信水平:95%、99% 等
意义:估计的精确度
| 分布类型 | 特点 | 应用 |
|---|---|---|
| 正态分布 | 钟形曲线、对称 | 自然现象、测量误差 |
| 二项分布 | 离散、成功/失败 | 质量控制、医学试验 |
| 泊松分布 | 稀有事件计数 | 交通事故、电话呼叫 |
| t 分布 | 小样本、厚尾 | 小样本推断 |
| 卡方分布 | 非负、偏态 | 方差分析、拟合优度 |
古埃及、巴比伦、中国进行人口普查和土地调查,是统计活动的萌芽
约翰·格朗特发表《死亡表的自然和政治观察》,首次系统分析人口数据,开创描述统计
惠更斯发表概率论著作,奠定概率论数学基础
雅各布·伯努利《推测术》出版,证明大数定律,奠定统计推断基础
阿亨瓦尔首次使用"Statistik"(统计学)一词,标志统计学成为独立学科
高斯发明最小二乘法,用于天体轨道计算,成为统计估计核心方法
高斯发表正态分布理论,成为统计学最重要的概率分布
拉普拉斯《概率的分析理论》出版,系统发展概率论和统计方法
高尔顿发现回归现象,发展相关与回归分析
卡尔·皮尔逊发展卡方检验,成为假设检验核心方法
戈塞特(笔名"学生")发现 t 分布,解决小样本推断问题
费希尔建立实验设计理论,发展方差分析,现代统计学成熟
奈曼和皮尔逊建立假设检验理论,完善统计推断体系
贝叶斯统计方法重新受到重视,成为统计学重要分支
统计学与计算机科学融合,数据科学兴起,统计学进入新时代
时间:17 世纪
地点:英国、德国、法国
贡献:人口统计、概率论
时间:19-20 世纪
地点:伦敦、剑桥
贡献:生物统计学派
时间:20 世纪
地点:各大学
贡献:统计学教育普及
时间:20-21 世纪
地点:全世界
贡献:成为科学基础
| 领域 | 影响 | 说明 |
|---|---|---|
| 医学 | 临床试验、流行病学 | 随机对照试验、生存分析 |
| 经济学 | 计量经济学 | 回归分析、时间序列 |
| 心理学 | 心理测量 | 量表编制、因素分析 |
| 生物学 | 生物统计 | 遗传分析、生态统计 |
| 社会科学 | 调查研究 | 抽样调查、问卷分析 |
| 工程学 | 质量控制 | 统计过程控制、可靠性 |
"统计学是现代科学的语法"
"统计学是科学的方法论"
"统计学是数据科学的基石"
| 方向 | 内容 | 目标 |
|---|---|---|
| 高维统计 | 高维数据分析、变量选择 | 处理大数据挑战 |
| 贝叶斯计算 | MCMC、变分推断 | 复杂模型推断 |
| 因果推断 | 因果图、反事实分析 | 从相关到因果 |
| 统计学习 | 机器学习理论、深度学习 | AI 与统计融合 |
| 可重复性 | 开放科学、预注册 | 提高研究质量 |