斯坦福教授李飞飞演讲:当前才是"首个真正的AI时代"
发布日期:2025-02-20 10:06:57
来源 | 李飞飞
编辑 | 三体君
在备受全球关注的巴黎AI峰会开幕式上,斯坦福大学的李飞飞教授进行了一场动人的演讲。作为ImageNet的创立者,她的每一次公开讲话都备受瞩目。
此次,她讲述了一个跨越五亿年的宏大故事:从生命最初获得感知能力的进化历程,到如今人工智能的飞速发展。“毫无疑问,未来的历史学家必将这一时期称为‘真正的第一个AI时代’。”李飞飞在演讲中如此强调。她认为,无论从哪个角度衡量——无论是计算机科学领域人工智能方向的学生数量、投资规模、初创企业数量,还是技术上的重大突破——人工智能都在引发一场前所未有的深度与广度的革命。
人工智能的历史与起源
人工智能常被视为技术与现代世界的象征,也是未来的代表——这正是我们今天聚集的原因。但对我而言,它的故事可以追溯到生命的起源,远在五亿年前,那时连“视觉”都不存在,生命处于一片黑暗中。
要在十分钟内讲述五亿年的历史显然不现实,所以我简化了一下:当进化让简单生物具备感知和反应能力时,一场进化竞赛开始了。最初只是被动感受光线,随后神经系统进化,感知逐渐发展为理解,理解又推动了行动,最终催生了“智能”,彻底改变了地球上的生命。
如今,人类的智能让我们能够设计和改变生活的方方面面,而我们不再满足于自然赋予的智慧,渴望创造出与我们一样聪明、甚至更强大的机器。
这也是为什么我们今天讨论的技术,其根源可以追溯到20世纪中叶。
艾伦·图灵早在计算机诞生前就思考如何让机器拥有类似人类的认知能力。他的思想激励了早期计算机科学家,他们在1956年提出了“人工智能”这一概念。
尽管他们曾乐观地认为几个月内就能破解智能的奥秘,但如今我们已经走过了820个月,虽然进展缓慢,但成果显著。
现代AI三大关键要素
人们对AI的另一个常见误解是,认为它仅限于计算机和工程领域。实际上,AI是一门高度跨学科且充满活力的学科。现代AI的兴起是三项重要且独立的技术与科学进步共同作用的结果。
首先是感知算法的研究,即探索生物(包括人类)如何理解世界,并开发出使机器具备类似能力的数学模型。在达特茅斯AI研讨会后,神经生理学家David Hubel和Torsten Wiesel揭示了哺乳动物视觉皮层的神经处理层次,获得了诺贝尔奖,彻底改变了我们对视觉处理的认知。与此同时,心理学家Frank Rosenblatt开发了早期的神经网络原型——感知器(Perceptron),启发了后来的计算机科学家,如Kunihiko Fukushima、Jeff Hinton、Yann LeCun和Yoshua Bengio,推动了深度学习神经网络的发展,使机器具备了强大的感知和分析能力。
与此同时,认知科学家开始研究人类大脑,揭示了我们感知环境的复杂性和深度。他们的研究表明,大脑与进化环境密不可分。大脑虽然被禁锢在颅骨中,但从生命之初就开始通过光线、触觉和声音等外部刺激学习。作为21世纪初的科学家,我最初专注于感知算法,但认知科学让我意识到“规模”的重要性。演化和发育通过大量数据塑造了人类智慧,我们推测,机器也可以通过现代数字设备和互联网的数据实现类似的学习。这一理念促使我们发起了ImageNet项目,这是第一个大规模AI训练数据集。我们提出,数据是让神经网络等算法“活起来”的关键,推动了AI的全球进步,并形成了今天的“规模定律”。
最后,强大的计算能力是这一切的基础。冯·诺依曼在20世纪40年代提出的计算机体系结构理论为现代计算机奠定了基础,70年代初微处理器的出现进一步推动了计算能力的发展。有趣的是,电子游戏行业在90年代初推动了图形处理器(GPU)的快速发展,英伟达等公司开发出强大的GPU,最终成为神经网络处理大规模数据的关键。因此,游戏玩家们也为AI的发展做出了贡献。
2012年之后的AI突破
当然,后续的发展不仅是“历史”,更是塑造未来的“蓝图”。2012年,在ImageNet挑战赛中,我的实验室首次大规模整合了算法、数据和计算这三大要素,几乎一夜之间改变了整个领域。那是机器首次能够准确理解和描述海量图像——数以百万计。如今这已司空见惯,但在当时,这是一项前所未有的突破,甚至像科幻小说中的场景。它如同推倒了第一块多米诺骨牌,随后的突破接踵而至,速度越来越快。
如今,十多年过去,我们仍在探索其深远影响。最初只是学术界的探索,如今却吸引了商界领袖、创业者、行业分析师甚至政治家的广泛关注。毫无疑问,历史学家将把这一时期称为“真正的第一个AI时代”。从任何指标来看——无论是AI专业的学生人数、投资规模、初创企业数量,还是其他方面——AI都是一场不断深化的革命。过去几年,AI迎来了更惊人的飞跃,尤其是大型语言模型的出现。
这些模型将算法、数据和计算力推向了新的高度,采用了名为“Transformer”的架构,训练数据几乎覆盖了整个互联网,并在最先进的芯片上运行。结果,机器的能力比过去十年的任何突破都更为迅猛。
如今,AI能够流畅地用自然语言对话,回答几乎任何领域的问题,甚至生成复杂的内容——从图像、声音到视频。ChatGPT的成就便是这一创新如何影响日常生活的最佳例证,其用户增长速度创下了历史纪录。这些能力不仅仅是表面上的“会说话”。从手写识别到博士水平的科学问答,AI在各种基准测试中的表现近年来飞速提升,某些对人类极具挑战的任务,AI的表现几乎呈垂直上升趋势。
大模型与近期AI进展
大型语言模型不仅能流畅使用语言,还在向更具“主动性”的方向发展。它们学会了将复杂任务分解为多个步骤,并逐步规划实现目标。
这种趋势被称为“具备代理能力的AI”,并将在2025年成为技术演进的新篇章。这些能力对用户和企业已非常实用,且未来发展潜力巨大。目前,AI主要在“语言智能”层面,但人类智能更为全面。AI正从“被动感知”向“主动行动”转变。在我的研究领域(涉及摄像头和机器人),AI正逐渐具备“创造、理解、推理和交互”的能力,与人和环境在数字或物理空间中互动,这被称为“空间智能”(spatial intelligence)和“具身智能”(embodied intelligence)。
例如,看到一张图片,视觉智能能识别其中的物品,如猫、植物、桌子和牛奶。但人类的感知系统不仅能识别,还会产生“抓住牛奶杯,防止它掉落”的冲动。这展示了“从观察到行动”的巨大差异,也表明AI正从观察者转变为“执行者”。图灵对未来的预见可能过于局限,因为智能的真正力量不仅在于“思考”,更在于用思考驱动行动。人类的空间智能创造了灿烂的文明,从金字塔到工业革命,从科学到艺术。
随着AI拓展我们的空间和具身智能,它将改变我们与世界的关系,并帮助我们创造和发现新事物。我们正在塑造一种面向未来的新形态。
空间与具身智能的兴起
接下来,我想展示几个“空间智能”技术快速发展的例子。这些案例来自我在斯坦福的学生和World Labs同事的工作:左上角是对复杂日常视频的语义标注,右上角是艺术风格迁移,左下角是通过文本生成视频的算法,右下角则是将任何图像转化为3D世界。比如,你现在看到的梵高画作中的法国咖啡馆,被我们用生成式AI模型带入了一个想象中的三维空间。
同样令人兴奋的是机器人技术,即“具身AI”。我实验室的两项研究将大型语言模型与视觉模型结合,使机器人能在更开放、真实的环境中执行日常任务,而不仅限于预设的动作序列。这些进展潜力巨大。
然而,如果AI从“会思考的机器”变为“会行动的机器”,社会在引导技术发展方向时将面临更紧迫的责任。毫不夸张地说,这正将我们带到一个对人类文明至关重要的历史节点。我们该如何应对?这正是我们本周聚集于此的主要原因。
以人为本的AI与三大核心价值
这个问题一直指引着我的研究。虽然找到简单答案几乎不可能,但我的探索始终围绕“以人为本的AI”这一主线,它包含三个核心价值:尊严、能动性和社区。
首先是尊严。面对强大的技术,我们常反思“我们是谁”。即使剥离我们能做的所有事情,自主决策和行动的尊严感仍是人类的本质。如果AI能帮助守护并“找回”这份尊严,尤其是帮助最脆弱的人群,那将是最令人激动的。例如,斯坦福大学的研究中,学生利用非侵入式脑电波记录患者的思维信号,通过AI解码并控制机械手臂完成烹饪动作,帮助瘫痪患者重获自主行动能力。
其次是能动性。我实验室的核心理念是探索如何让AI“增强”而非取代人类能力。尽管技术变革冲击劳动力市场,AI仍能在创造力、医疗、科研和制造业等方面增强人类能力。过去十年,我们研究AI如何改进医疗服务,例如利用智能摄像头监督洗手规范、记录病人复健情况、跟踪手术器械使用等,提高医疗质量并减轻医护人员负担。
最后是社区。科技常被批评“拉远人们距离”,催生信息茧房和偏见强化。AI现在面临两条路:一是主导社交体验,强化偏见;二是帮助构建更健康、包容的社区。例如,利用AI和虚拟现实为阅读障碍学生提供个性化辅助工具,或开发AI专家系统缓解语言治疗师短缺,帮助儿童进行早期语言干预。
AI治理:理性、务实
与多方协作
这些例子引出了我今天想分享的最后一个观点:在这个关乎人类文明未来的关键时刻,我们如何以理性、务实和负责任的方式治理AI,使其继续释放巨大潜力?至少,我们需要从以下几个方面着手:
首先,治理应基于科学而非科幻。当前关于AI的讨论中充斥着夸大和危言耸听,导致政策制定被误导。我们应以科学方法评估AI的实际能力和局限,制定精准、可执行的政策,并基于现实而非幻想。
其次,我们应以务实而非意识形态化的态度看待AI治理。AI是一项强大技术,若使用得当,能显著改善我们的生活和工作。因此,我们不应阻碍这项年轻技术的探索与研究,而应关注其具体应用,确保其被善用,并防范潜在风险。
最后,我们需要投入更多资源,构建一个健康、繁荣的AI生态系统,让学术界、创业者、开源社区和公共部门都能与大企业共同参与并发挥重要作用。如果AI真要改变世界,各行各业和社会各群体都需在这一变革中发挥作用,共同塑造未来。
我在演讲开头提到,现代AI的兴起得益于算法、数据和计算力的结合。但如果这些资源仅掌握在少数公司手中,AI生态系统将面临研究乏力、人才受限、开源项目资源不足等问题。
75年前,艾伦·图灵提出了“人类是否有胆量创造能思考的机器”的挑战。如今,我们已将这一挑战推向了难以想象的高度。AI技术的飞跃令人惊叹,我认为现在是时候提出一个新的挑战:与其问“我们能否创造AI”,不如问“我们能否创造一股向善的AI力量”。
简而言之,我想邀请大家共同努力,构建“以人为本”的AI。谢谢大家。
免责声明
我们尊重每一位原创作者的心血,转载均注明文章作者及来源。若涉及版权问题,请与我们联系。我们会第一时间处理。
关于我们:
洞察全球商业规律与趋势、助力中国企业征战全球;我们提供出海一站式服务、目标市场出海深度考察与资源对接。