从图灵测试到大语言模型 · 人类智慧的机器延伸
人工智能的思想源头可以追溯到 20 世纪 40 年代。这一时期的理论奠基为 AI 的诞生 提供了哲学基础、数学工具和工程蓝图。图灵、麦卡洛克等先驱者的工作, 为后来的人工智能革命播下了种子。
人工智能的诞生不是偶然的,而是建立在多个学科的理论突破之上: 数理逻辑、控制论、信息论、神经科学等。这些学科的交叉融合, 为"机器能否思考"这一古老问题提供了科学的解答框架。
图灵是人工智能思想的奠基人。1936 年,他提出"图灵机"概念, 为现代计算机奠定了理论基础。1950 年,他在哲学杂志《Mind》上发表 划时代论文《计算机器与智能》,提出著名的"图灵测试", 为判断机器是否具有智能提供了可操作的标准。
图灵提出"模仿游戏":裁判通过文本与一个机器和一个人交流, 如果裁判无法可靠地区分机器和人,那么机器就通过了测试。 图灵预测,到 2000 年,机器能在 5 分钟的测试中让 30% 的裁判误判。
1943 年,神经生理学家麦卡洛克和数学家皮茨合作发表论文 《神经活动中内在思想的逻辑演算》,提出第一个人工神经元数学模型 "M-P 神经元模型"。这是人工神经网络的开端, 证明了简单神经元网络可以执行逻辑运算,为后来的深度学习奠定了基础。
诺伯特·维纳在 1948 年创立"控制论",研究动物和机器中的 控制与通信机制,为 AI 提供了系统论基础。克劳德·香农 在 1948 年创立"信息论",提出信息的数学理论,为 AI 的信息处理 提供了理论基础。
1956 年夏天,达特茅斯学院的一场会议标志着人工智能作为 一门独立学科的正式诞生。"人工智能"这一术语首次被提出, 开启了 AI 研究的第一个黄金时代。
在美国达特茅斯学院,约翰·麦卡锡、马文·明斯基、 克劳德·香农、纳撒尼尔·罗切斯特等科学家聚集在一起, 讨论"如何让机器模拟人类智能"。会议首次提出"人工智能" (Artificial Intelligence)这一术语,标志着 AI 作为 独立学科的诞生。这次会议被公认为 AI 的"创世纪"。
麦卡锡在会议提案中写道:"我们将尝试找出如何让机器 使用语言、形成抽象概念、解决人类 reserved 的问题、 并自我改进。我们认为这些问题的显著进展将在一个夏天内实现。" 这种乐观主义贯穿了 AI 早期发展。
1956 年,纽厄尔和西蒙开发了"逻辑理论家"(Logic Theorist), 这是第一个人工智能程序,能够证明数学定理。 1957 年,他们又开发了"通用问题求解器"(GPS)。 他们提出"物理符号系统假说",认为符号操作是智能的核心。 两人于 1975 年获得图灵奖。
1952 年,塞缪尔开发了跳棋程序,这是最早的机器学习程序之一。 程序能够通过自我对弈学习提高棋艺。1959 年, 他首次提出"机器学习"(Machine Learning)这一术语, 定义为"让计算机具有无需显式编程就能学习的能力"。 他的工作为强化学习奠定了基础。
由于技术限制、期望过高和资金削减,人工智能在 1970 年代 和 1980 年代末经历了两次"寒冬"。研究者意识到早期乐观预测 过于天真,AI 研究进入反思和调整期。
1970 年代初,AI 研究遭遇重大挫折。早期承诺的"机器将在几年内 达到人类智能水平"未能实现。政府和基金会对 AI 失去信心, 大幅削减研究经费。
1973 年,英国数学家詹姆斯·莱特希尔受政府委托发布报告, 批评 AI 研究未能实现承诺,导致英国大幅削减 AI 研究经费。 这份报告引发了全球对 AI 的质疑,加剧了 AI 寒冬。
1980 年代末,专家系统泡沫破裂。专家系统虽然在特定领域 取得成功,但维护成本高、难以扩展、无法处理不确定性。 随着个人电脑兴起,专用 AI 硬件市场崩溃,AI 公司纷纷倒闭, 第二次 AI 寒冬来临。
1980 年代,专家系统带来 AI 的第一次商业成功。专家系统 基于人类专家的知识库和推理引擎,能在特定领域提供专业建议。
第一个成功的专家系统,由爱德华·费根鲍姆开发, 能根据质谱数据推断分子结构,在化学领域广泛应用。
斯坦福大学开发的医疗诊断系统,能诊断血液感染 并推荐抗生素,准确率达到专家水平。
DEC 公司使用的计算机配置系统,每年为公司 节省数千万美元,是第一个商业成功的专家系统。
爱德华·费根鲍姆提出"知识工程"概念, 强调知识在 AI 中的核心地位。他提出"知识就是力量", 认为 AI 的关键在于获取和表示领域知识。费根鲍姆于 1994 年 获得图灵奖。
1980 年代,机器学习开始复兴。反向传播算法的重新发现 使神经网络训练成为可能。决策树、归纳逻辑编程等方法 也取得进展。
1990 年代,AI 研究从"基于知识"转向"基于数据"。 机器学习成为主流,统计方法取代符号推理。 互联网的兴起为机器学习提供了海量数据。
虽然反向传播算法在 1970 年代就被提出,但直到 1986 年 鲁梅尔哈特、辛顿和威廉姆斯的论文发表,才引起广泛关注。 这一算法使多层神经网络的训练成为可能, 开启了连接主义的复兴。
1990 年代,统计机器学习方法蓬勃发展:
IBM 的"深蓝"计算机在国际象棋比赛中击败 世界冠军加里·卡斯帕罗夫,这是 AI 历史上的 重大里程碑,展示了 AI 在复杂决策中的潜力。
NASA 的"勇气号"和"机遇号"火星车使用 AI 技术 自主导航,在火星表面进行科学探测。
2012 年,AlexNet 在 ImageNet 竞赛中的突破性表现 标志着深度学习时代的到来。GPU 计算、大数据和 算法改进共同推动了 AI 的第三次浪潮。
辛顿是深度学习的奠基人之一。他坚持研究神经网络数十年, 即使在 AI 寒冬期间也未放弃。2012 年,他的学生 Alex Krizhevsky 开发的 AlexNet 在 ImageNet 竞赛中取得突破性成绩。 辛顿在反向传播、玻尔兹曼机、胶囊网络等方面有重要贡献。 2018 年获得图灵奖。
杨立昆是卷积神经网络(CNN)的创始人。他在 1980 年代 开发了 LeNet,用于手写数字识别,被银行广泛用于 支票识别。2013 年加入 Facebook,领导 AI 研究。 2018 年与辛顿、本吉奥共同获得图灵奖。
本吉奥在序列建模、注意力机制等方面有重要贡献。 他是 Transformer 架构的关键贡献者之一。 长期致力于推动 AI 的伦理和安全性研究。 2018 年与辛顿、杨立昆共同获得图灵奖。
Alex Krizhevsky 的 AlexNet 在 ImageNet 竞赛中 以 15.3% 的错误率大幅领先第二名(26.2%), 标志着深度学习在计算机视觉中的统治地位确立。
Google DeepMind 的 AlphaGo 以 4:1 击败围棋世界冠军 李世石,这是 AI 历史上的里程碑。围棋的复杂度远超 国际象棋,曾被认为 AI 需要数十年才能掌握。
深度学习使语音识别错误率从 25% 降至 5% 以下, Siri、Alexa、Google Assistant 等语音助手 进入日常生活。
特斯拉、Waymo 等公司推动自动驾驶技术发展, 深度学习在感知、决策等关键环节发挥核心作用。
2018 年以来,以 Transformer 为基础的大语言模型(LLM) 引发 AI 领域的又一次革命。GPT 系列、BERT 等模型在 自然语言处理任务中取得突破性进展,展现出 令人惊讶的通用智能特征。
2017 年,Google 团队发表论文《Attention Is All You Need》, 提出 Transformer 架构。它完全基于注意力机制, 摒弃了传统的 RNN 和 CNN,实现了并行训练和 长距离依赖建模。Transformer 成为大语言模型的基础架构。
OpenAI 发布 GPT-1,1.17 亿参数, 展示了预训练 + 微调范式的有效性。
GPT-2 拥有 15 亿参数,能生成高质量文本, 因担心滥用 initially 未完全开源。
GPT-3 拥有 1750 亿参数,展现出惊人的 少样本学习能力,引发全球关注。
GPT-4 在多模态理解、推理能力上进一步提升, 通过了律师考试、医学考试等专业测试。
中国在大模型领域也取得重要进展:
图灵发表《计算机器与智能》,提出图灵测试
AI 作为学科正式诞生,"人工智能"术语首次提出
塞缪尔提出"机器学习"术语
资金削减,研究陷入低谷
AI 第一次商业成功
专家系统泡沫破裂
AI 里程碑事件
辛顿提出深度信念网络
深度学习革命爆发
AI 在围棋领域超越人类
大模型时代开启
1750 亿参数,少样本学习
AI 进入大众视野
多模态能力突破
| 人物 | 生卒年 | 国籍 | 核心贡献 | 荣誉 |
|---|---|---|---|---|
| 艾伦·图灵 | 1912-1954 | 英国 | 图灵机、图灵测试 | 图灵奖命名来源 |
| 约翰·麦卡锡 | 1927-2011 | 美国 | "AI"术语、Lisp 语言 | 图灵奖(1971) |
| 马文·明斯基 | 1927-2016 | 美国 | 框架理论、神经网络 | 图灵奖(1969) |
| 艾伦·纽厄尔 | 1927-1992 | 美国 | 逻辑理论家、GPS | 图灵奖(1975) |
| 赫伯特·西蒙 | 1916-2001 | 美国 | 物理符号系统 | 图灵奖(1975)、诺贝尔奖 |
| 阿瑟·塞缪尔 | 1901-1990 | 美国 | "机器学习"术语、跳棋程序 | IEEE 先锋奖 |
| 人物 | 生卒年 | 国籍 | 核心贡献 | 荣誉 |
|---|---|---|---|---|
| 杰弗里·辛顿 | 1947- | 英国 | 反向传播、深度信念网络 | 图灵奖(2018) |
| 杨立昆 | 1960- | 法国/美国 | 卷积神经网络、LeNet | 图灵奖(2018) |
| 约书亚·本吉奥 | 1964- | 加拿大 | 序列建模、注意力机制 | 图灵奖(2018) |
| 安德鲁·恩格 | 1976- | 英国/美国 | 在线教育、AI 普及 | Coursera 创始人 |
| 李飞飞 | 1976- | 中国/美国 | ImageNet、计算机视觉 | 斯坦福教授 |
| 人物 | 生卒年 | 国籍 | 核心贡献 | 荣誉 |
|---|---|---|---|---|
| 伊利亚·苏茨克维 | 1985- | 以色列/加拿大 | OpenAI 联合创始人、GPT | OpenAI 首席科学家 |
| 萨姆·阿尔特曼 | 1985- | 美国 | OpenAI CEO、ChatGPT | OpenAI CEO |
| 雅各布·德夫林 | - | 美国 | BERT 主要作者 | Google 研究员 |
| 吴恩达 | 1976- | 英国/美国 | 深度学习教育、Coursera | 斯坦福教授 |
AI 发展史告诉我们:技术突破需要长期坚持; 过度承诺会导致期望落差;跨学科合作至关重要; 伦理和安全必须与技术发展同步。