AI的下一个命运将会是什么? “干妈”李菲菲写下万字长文给出答案。

你能相信吗?人工智能现在可能正在愚弄我们。李飞飞用“IA 的马德里”和科学手段来定义所有语言模型,并在现实中实现了巨大的进步,这在现实中是残酷的。虽然AI看似无所不能,但实际上它“生活在黑暗中”。写诗、写诗和创作视频,以真实的方式呈现 90 级的想象,以真实的方式呈现虚拟角色。在李飞飞看来,造成这种困境的根本原因是我们走错了方向。 IA 的目标是构建最伟大的语言模型,让中国人具备天生的能力:包括太空情报。这是实现真正通用人工智能的唯一途径。 1.灵魂的拷问:AI为何依然“盲目”?原文相当长,我们就从直观开始吧。让人工智能写一首诗,它会写出一首诗几分钟就变成李白和杜甫。但你让人工智能问你一些简单的物理问题,比如“把这个杯子旋转90度。它看起来像什么?” “这个迷宫的出口在哪里?” “你想估算一下桌子到门的距离吗?” AI的反应基本上是“盲目的”。留意一段精彩的人工智能视频,其中包含多个“交叉”镜头。突然,一个人的手上多了一根手指,或者一个物体在没有任何警告的情况下撞破了墙壁。李菲菲敏锐地指出,这是因为他们不了解物质世界。他们无法真正理解距离、大小、方向和物理定律。因此,虽然我们期待人工智能成为科幻电影中全能的管家,但现实是: · 家庭仍然没有机器人来帮助做家务。 · 在需要理解三维结构的领域,例如药物发现和新材料发现,人工智能进展缓慢。 · 人工智能不能真正理解建筑师、游戏设计师和电影导演心目中的“世界”。 2. 藏宝图谜题中缺失的一块:缺失的空间智能 AI 什么是“空间智能”?李飞飞说,它是人类认知的“支架”。早在我们学习说话或写字之前,我们就已经获得了以下技能: · 婴儿花了一到两年的时间通过抓、扔、咬和看来理解世界。 · 当您靠边停车时,您的大脑会快速计算保险杠与路缘之间的距离。 · 当你的朋友扔出钥匙时,你可以无意识地接住它,而无需拿纸和笔计算抛物线。 · 如果你半夜醒来倒水,打开灯,你可以把手伸进杯子里倒水。李飞飞还举例说明了人类的伟大发现和文明进步也对这种能力至关重要,他说古希腊的埃拉托色尼计算了圆周率。通过从两个不同角度观察阴影来了解地球的情况。 · 哈格里夫斯发明了“旋转珍妮”,这也依赖于对宇宙的观察和理解。 · 沃森和克里克通过亲手构建 3D 分子模型,“详细”描述了 DNA 双螺旋结构。李飞飞认为,空间智能是人类想象力、创造力的关键,是与世界互动的基础。遗憾的是,目前的AI基本不具备这个能力。 3、AI的下一步:从“语言模型”到“世界模型” 那么如何才能让AI“睁开眼睛”看世界呢?李菲菲有她自己的答案。 AI的未来不在于“莫”语言模型”(LLM),而在于全新的“世界模型”。她认为,真正的“世界模型”必须是“三位一体”。生成:必须能够创建符合物理和几何定律的3D世界。例如,我们“看到”重力,我们知道物体下落,我们知道水向下流。·Multimodal:它必须能够处理所有输入。例如,它不仅可以理解用户所说的“话语”,还可以理解照片、视频、详细信息,甚至用户的一个“手势”。 · 互动:这是最重要的。当命令一个“行动”时,需要能够预测“下一刻会发生什么”。不。例如,如果您推动积木,您将能够看到它们会掉落。李飞飞坦言,这项任务比训练一个语言模型(或+三维时间)要困难得多,受万有引力、物理定律等无数复杂规则的约束。李飞飞透露,他一年前与他人共同创立了World Labs来克服这个问题,并于近期向少数用户展示了第一个全球模型Marble。 4. 这将如何改变我们的生活?一旦人工智能获得空间智能,这将是一场真正的革命。首先是创造力的“超能力”。李飞飞开发的Marble模型World Labs 团队允许电影制作人、游戏设计师和建筑师使用“快速单词”快速创建和迭代 3D 世界。未来,这些人将不再需要学习如何使用复杂的3D软件。只需用语言描述它,它就会生成一个您可以进入并与之交互的 3D 世界。届时,人人都可以成为“创造者”。其次,它是真正的“体现智能”。机器人将不再是“笨拙”的机械臂。受益于“世界模式”,他们将在模拟环境中学习数千种实用技能,走进家庭和医院,成为称职的助手和护理人员。此外,李飞飞还特别提到,这样的人工智能将成为未来科教的“加速器”。 · 医疗保健:人工智能可以模拟多个维度的分子相互作用,以加速药物发现过程或使医生能够分析图像并为患者和护理人员提供持续的支持。 · 教育上:学生不再只是单纯看书,还可以“行走”古罗马的街道,直接“探索”牢房内部。教师可以在互动的环境中进行教学,专业人士可以在高度逼真的模拟环境中练习和掌握复杂的技能。 ・科学研究:基于对海洋、太空等深度的模拟,可以在人类物理无法到达的环境中扩大科学探索的范围。将多维模拟与现实世界的数据收集相结合,使我们能够突破实验室观察和理解的极限。结论:人工智能的最终目标是“赋能人类”。李飞飞是帮助开创人工智能现代时代的科学家之一,他在文章的最后回到了他的核心人文主义焦点。他强调,人工智能的最终目标不是取代人类,而是“赋能”人类。 “与其取代人类的判断力、创造力和同理心,不如让人工智能增强她认为人工智能是由人类开发、使用和控制的,人类的能动性和尊严应该始终受到尊重。神奇之处在于扩展我们的能力,让我们更具创造力和效率。“空间智能”恰恰代表了“更深刻、更丰富、更强大的生活愿景”。我们的希望是“制造与现实世界高度一致的机器,并成为应对重大挑战的真正合作伙伴。”也许机器真正的智能始于这个“启示”。 【以下为李飞飞文章全文】 从文字到世界:空间智能是人工智能的下一个前沿 1950年,当计算机科学只不过是自动算术和简单逻辑的代名词时,阿兰·图灵提出了一个至今仍引起共鸣的问题。 “机器能思考吗?”需要非凡的想象力才能想象你所预见的事情。有一天,智力可能会不是天生的,而是后天塑造的。这个想法引发了一场不懈的科学探索,后来被称为“人工智能”(AI)。尽管进入人工智能领域已经25年了,图灵的愿景仍然激励着我。但我们离它有多近呢?答案不是三言两语就能解释清楚的。大型语言模型(LLM)等尖端人工智能技术正在开始改变我们获取和处理抽象知识的方式。他们在一个黑暗的房间里。就像世界上的文字大师一样。雄辩但缺乏经验,知识丰富但脱离实际。空间智能将改变我们创建现实和虚拟世界以及与现实和虚拟世界互动的方式,彻底改变讲故事、创造力、机器人技术、科学发现等。这是人工智能的下一个前沿领域。自从进入这个领域以来,对视觉和空间智能的追求一直是我的“北极星”。这就是我花了几年时间创建 ImageNet 的原因。这是第一个大规模的视觉学习和b与现代计算设备(例如神经网络算法和图形处理器)兼容的嵌入数据集。 ■ 处理单元(GPU)成为导致现代人工智能诞生的三个关键要素之一。这就是为什么我在斯坦福大学的学术实验室在过去十年里一直致力于将计算机视觉和机器人学习结合起来。这就是为什么我一年多前与联合创始人 Justin Johnson、Christoph Lasner 和 Ben Mildenhall 共同创立了 World Labs,以首次充分实现这一潜力。本文解释了什么是空间智能、为什么它很重要,以及我们如何构建释放这种能力的世界模型。它的影响将重塑创造力、体现智能和人类进步。空间智能:人工智能支持人类认知从未如此令人兴奋。生成式人工智能模型,例如大规模的语言模型,它们已经从实验室转移到日常生活中,并已成为数十亿人的工具乐于创造、富有成效和沟通。它们展示了以前认为不可能的功能,可以轻松创建一致的文本、大量代码、逼真的图像,甚至短视频剪辑。人工智能是否会改变世界已经不再是问题。根据任何合理的定义,这已经完成了。但还有很多事情仍然是我们力所能及的。自主机器人的愿景仍然很有趣,但它仍然是推测性的,而且未来主义者距离我长期以来所承诺的成为我日常生活的一部分还有很长的路要走。显着加速治疗疾病、发现新材料和粒子物理学等领域的研究的梦想在很大程度上尚未实现。无论是帮助学生学习复杂的分子化学概念、帮助建筑师可视化空间、帮助电影制片人构建世界,还是支持那些完全追求人工智能的人,人工智能将真正理解并赋予人类创造者权力的承诺仍然难以实现。沉浸式虚拟体验。为了理解为什么这些能力如此难以捉摸,我们必须研究空间智能是如何进化的以及它如何塑造我们对世界的理解。视觉长期以来一直是人类智能的基础,但它的力量来自更根本的东西。早在动物学会筑巢、照顾幼崽、通过语言交流和建立文明之前,“感知”这个简单的行为就悄然开始了向智慧的进化之旅。这种看似孤立的从外界收集信息的能力,例如感知光的亮度或触摸纹理,它在感知和生存之间架起了一座桥梁,并且随着每一代人的发展而变得更加强大和复杂。神经元在这座桥上一层层生长,形成解释世界并协调有机体与其环境相互作用的神经系统。因此,许多科学家推测感知和行动已经成为我是驱动智能进化的中心循环。自然是我们人类诞生的基础,是感知、学习、思想和行动的最高体现。空间智能在定义我们如何与物理世界互动方面发挥着关键作用。我们每天都依靠它来执行最平凡的动作,例如停车时想象保险杠与人行道之间的间隙不断缩小。接住从房间另一头扔来的钥匙。在拥挤的人行道上行驶而不会发生碰撞。我半夜醒来,在玻璃杯里装满水,没有开灯,就把手伸进玻璃杯里倒了。 。在更极端的情况下,消防员在倒塌建筑物内不断变化的烟雾中穿行,对结构的稳定性和生存机会做出瞬间判断,并通过手势、肢体语言和无法用语言代替的常见专业本能进行交流。原来是好几个几个月后,他就能说这种语言了。在几年的时间里,婴儿和幼儿通过与环境的有趣互动来了解世界。所有这一切都直观而自然地发生。这是机器尚未达到的流动性水平。空间智能也是我们想象力和创造力的基础。讲故事的人使用各种视觉媒体,从古代洞穴壁画到现代电影和沉浸式视频游戏,在他们的脑海中创造出极其丰富的世界,并供其他人使用。无论孩子们在海滩上堆沙堡还是在电脑上玩《我的世界》,空间想象力都构成了现实或虚拟世界中互动体验的基础。在许多工业应用中,对象、场景和动态交互环境的模拟为无数关键业务用例提供支持,从工业设计到数字孪生和机器人培训。历史充满了文明的决定性时刻,其中发生了争吵情报发挥了核心作用。在古希腊,埃拉托色尼将影子转化为几何学,并通过测量太阳接触赛耶纳那一刻亚历山大港的 7 度角来计算地球的周长。哈格里夫斯的珍妮纺纱机通过空间视觉彻底改变了纺织制造。通过将几张 huChairs 并排放置在框架内,工人们能够同时旋转多个线程,从而将生产力提高八倍。沃森和克里克通过亲手构建三维分子模型发现了DNA的结构。他们继续摆弄金属板和电线,最终“匹配”碱基对的空间排列。在这两种情况下,空间智能都具有先进的文明,因为科学家和发明家需要操纵物体、可视化结构并对物理空间进行推理,而这些都无法仅用语言来表达。空间智能是我们认知的脚手架n 已构建。无论我们是被动观察还是主动创造,它都会发挥作用。它驱动我们的推理和计划,即使是在最抽象的主题上。 。它是我们与同伴以及环境本身互动的方式的基础,无论是口头上还是身体上。我们大多数人都像埃拉托色尼。我们并不是每天都会发现事物的新真相,但我们通常都会以同样的方式思考。也就是说,我们通过感官知觉来理解复杂的世界,并利用我们的直觉理解来理解它在物理和空间层面上的运作方式。不幸的是,当前的人工智能仍然不这么想。近年来确实取得了巨大进步。除了文本数据之外,大规模多模态语言模型(multimodal LLM、MLLM)也使用大量多媒体数据进行训练,从而引入基本的空间感知。今天的人工智能可以分析照片、回答相关问题并生成超现实的图像和短视频。阿德瓦传感器和触觉技术的发展也开始让我们的下一代机器人能够操纵物体和工具。即使在最受限的环境中也是如此。然而残酷的现实是,人工智能的空间感知距离人类水平还存在很大差距,其局限性很快就会暴露出来。最先进的大规模多模态语言模型在估计距离、方向和大小等任务上很少表现得比随机猜测更好,或者通过从新角度重新生成对象来执行“心理旋转”。他们无法穿越迷宫、识别捷径或预测基本的物理现象。人工智能生成的视频很新颖,当然也很有趣,但几秒钟后它们往往会变得不一致。虽然当今的下一代人工智能在阅读、写作、探索数据和识别模式方面表现出色,但这些模型在表示物理世界并与之交互时存在根本局限性。我们的世界观是整体的。我们认为不是不仅涉及我们所看到的,而且还关注空间中的所有事物如何相互关联、它们的含义以及它们为何重要。空间智能的力量在于你可以通过想象、推理、创造和互动来理解一切,而不仅仅是解释。如果没有它,人工智能就会与它试图理解的物理现实脱节。我们无法更有效地驾驶汽车,引导机器人穿过我们的家庭和医院,为学习和娱乐创造新的沉浸式互动体验,或者加速材料科学和医学的发现。哲学家维特根斯坦曾写道:“我的语言的限制意味着我的世界的限制。”我不是哲学家。但我知道,至少对于人工智能来说,世界不仅仅是文字。空间智能代表了超越语言的前沿。它是连接想象力、感知和行动的能力,释放机器的潜力,真正改善人类的生活,从医疗保健到创意创造力,从科学发现到日常护理。人工智能的下一个十年:构建具有真正空间智能的机器 那么我们如何构建具有空间智能的人工智能呢?我们如何建造能够像埃拉托色尼那样进行视觉推理、能够像工业设计师那样精确地进行设计、能够像讲故事的人一样进行富有想象力的机器?以及像急救人员一样与环境流畅交互的模型?构建具有空间智能的人工智能需要比大规模语言模型更雄心勃勃的目标。世界模型是一种新型的生成模型,能够理解、推理、生成语义、物理、几何和动态复杂的真实或虚拟世界并与之交互,远远超出了当前大规模语言模型的范围。该领域仍处于起步阶段,当前的方法范围从 R 模型抽象推理到视频生成系统。 World Labs 成立于 2024 年初,坚信基本方法仍然存在正在建立,这将是下一个十年的决定性挑战。在这个新兴领域,制定指导其发展的原则至关重要。对于空间智能,世界模型由三个基本特征定义: · 生成性:世界模型可以生成感知上、几何上和物理上一致的世界。为了解锁空间理解和推理,世界模型必须能够生成自己的模拟世界。无论这些世界是代表真实空间还是虚拟空间,我们都必须能够基于语义或感知指令生成无限多种模拟世界,同时保持几何、物理和动态的一致性。研究界想知道这些世界是否应该以隐式或显式的独特方式表达它们的几何形状。我们正在积极调查。此外,我相信通用世界模型除了需要强大的潜在表示之外,还必须能够产生明确且可观察的世界状态作为输出,可以适应许多不同的用例。特别是,我们对现在的理解必须与其过去以及当前状态之前的世界状况保持一致。 ·多模式:世界模型在设计上就是多模式的。与动物和人类一样,世界模型必须能够处理多种形式的输入,在生成人工智能领域称为“提示”。给定图像、视频、深度图、文本指令、手势和动作等信息,世界模型应该能够预测或生成世界最完整的状态。这需要忠实地处理真实视觉的视觉信息,同时以同等的流动性解释语义指令。这允许代理和人类通过多个输入与模型就世界进行交流并接收多个输出。 ·交互性:世界模型可以根据输入动作生成下一个状态。最后,如果一个行动或目标符合标准给定世界模型的关键字中,其结果必须包括以下世界状态,无论是隐式表达还是显式表达。仅给定动作作为输入,无论有或没有目标状态,世界模型都必须产生与世界的先前状态、预期目标状态及其语义、物理定律和动态行为一致的输出。随着空间智能世界模型的推理和生成能力变得更加强大和鲁棒,可以想象,给定一个目标,世界模型本身不仅会预测世界的下一个状态,而且还会基于新的状态来预测下一个状态。行动。这一挑战的范围超出了人工智能之前面临的任何挑战。尽管语言纯粹是人类认知的生成现象,但世界遵循着更为复杂的规则。例如,在地球上,重力控制运动,原子结构决定光如何产生颜色和亮度,以及无数的物理所有的法则都支配着每一次互动。即使是最奇妙和最具创造力的世界也是由遵守定义它们的物理定律和动态行为的空间物体和代理形成的。配置。语义、几何、力学、物理学:协调所有这些需要一种全新的方法。表示世界的维度比表示语言等连续的一维信号复杂得多。要实现一个提供人类所享有的通用能力的全球模型,需要克服一些障碍和困难的技术策略。在世界实验室,我们的研究团队正在努力朝着这一目标取得根本性进展。以下是当前研究主题的一些示例。新的通用训练任务函数:在大规模语言模型中定义像“下一个令牌预测”一样简单而优雅的通用任务函数长期以来一直是世界建模研究的中心目标。这些功能本身就比较困难由于输入和输出空间的复杂性,无法形式化。尽管还有很多需要研究的地方,但这个目标函数和相应的表示应该反映几何和物理定律,同时尊重想象力和世界模型作为现实“扎根”表示的基本性质。大量的训练数据:电子训练世界模型需要比文本处理复杂得多的数据。好消息是优秀的数据源已经存在。我们的互联网规模的图像和视频集合是丰富且易于访问的培训资源。面临的挑战是开发能够从这些二维图像或基于视频帧的信号(即 RGB)中提取更深层空间信息的算法。过去十年的研究证明了语言模型中数据量和模型大小之间的缩放法则的力量。全局建模的一个重大进步将是构建可以大规模利用现有视觉数据的架构e.此外,我们并不打算低估高质量合成数据和触觉和深度信息等附加模式的力量。这些补充了培训过程关键步骤的互联网规模数据。但前进的道路是通过更好的传感器系统、更强大的信号提取算法和更强大的神经模拟。这取决于应用方法。新的模型架构和表示学习:世界建模研究将不可避免地推动模型架构和学习算法的进步,特别是超越当前的大规模多模态语言模型和视频广播范例。这两种范式通常将数据“标记”为一维或二维序列,从而使简单的空间任务(例如计算短视频中未重复的椅子数量或记住一小时前的房间是什么样子)变得不必要地困难。替代架构,例如自上而下的“标记化”,”可能会有所帮助。文本和记忆的三维或四维感知方法。例如,世界实验室最近在基于实时帧的生成模型 RTFM 的工作中证明了这种变化,该模型使用基于空间的帧作为空间记忆的一种形式,以实现高效的实时生成,同时保持生成世界的连贯性。很明显,在通过全局建模完全解锁空间智能之前,我们仍然面临着艰巨的挑战。这项研究不仅仅是一项理论练习,它是核心World Labs 最近与一些用户分享了 Marble 的概述,这是世界上第一个使用多模式输入线索来生成和维护一致的 3D 环境,以便用户和故事讲述者探索、互动甚至创建创意工作流程的引擎。尽快公开! Marble 只是创建真正的空间智能世界模型的第一步。随着进步的加速,研究人员、工程师、用户和企业领导者开始意识到其令人难以置信的潜力。下一代世界模型将使机器实现全新水平的空间智能。这一成就释放了当前人工智能系统仍缺少的重要功能。人工智能发展的动机是利用全球模型为人类建设一个更美好的世界,这一点至关重要。现代 AIA 作为对 2000 年代的到来做出贡献的科学家之一,我的动机总是很明确。人工智能应该增强人类的能力,而不是取代人类。在 mu 工作多年,我一直致力于使 AI 开发、部署和治理与人类需求保持一致。如今,关于科技乌托邦和末日的极端故事有很多,但我仍然保持更现实的看法。 AI是人类开发出来的,为人类所使用,也为人类所统治。人的独立和尊严必须始终得到尊重。神奇之处在于扩展我们的能力。我们变得更有创造力、联系更紧密、生产力更高、更有成就感。空间智能代表了这一愿景。人工智能使人类创造者、护理人员、科学家和梦想家能够实现以前不可能实现的目标。这种信念促使我致力于将空间智能作为人工智能的下一个伟大前沿。空间智能的应用跨越不同的时间线。创意工具都在这里。 World Labs 的 Marble 将这些功能交给了创作者和讲故事的人。机器人技术代表了一个雄心勃勃的中期目标,即继续微调认知和行动之间的回路。更具创新性的科学的应用将需要更长的时间,但有望对人类的繁荣产生重大影响。在所有这些时间线中,有几个领域脱颖而出,有可能重塑人类能力。钍这需要巨大的集体努力,远远超出任何团队或公司所能实现的。整个人工智能生态系统——研究人员、创新者、企业家、公司甚至政策制定者——需要齐心协力实现共同目标。朝着你的愿景努力。但这个愿景值得追求。这个未来包括: 创造力:为讲故事和沉浸式体验带来超能力“创造力是享受乐趣的智慧。”这是我个人英雄阿尔伯特·爱因斯坦最喜欢的名言之一。早在书面语言出现之前,人类就讲故事并在洞穴的墙壁上画画,代代相传,围绕他们共同的故事建立了整个文化。故事是我们理解世界的方式,跨越时间和空间的联系,探索人类的意义,最重要的是,找到生活的意义和我们内心的爱。如今,空间智能有潜力改变方式我们创造和体验故事,尊重其根本重要性,并将其影响从娱乐扩展到教育,从设计扩展到建筑。 World Labs 的 Marble 平台为各类电影制作人、游戏设计师、建筑师和故事讲述者提供了前所未有的空间能力和编辑控制,使他们能够快速创建和迭代完全可探索的 3D 世界,而无需传统 3D 设计软件的繁重开销。创造性行为本身是不可改变的、充满活力的、人性化的。人工智能工具只是扩展和加速创作者可以实现的目标。其中包括: · 叙事体验的新维度:电影制作人和游戏设计师使用 Marble 创造不受预算或地理限制的整个世界,探索传统制作流程中难以驾驭的不同场景和视角。随着不同形式的媒体和娱乐之间的界限变得越来越模糊,我们正在接近一种新型的整合方式。结合艺术、模拟和游戏的互动体验:任何人(不仅仅是工作室)都可以创建自定义世界并沉浸在自己的故事中。随着将概念和故事板转化为完整体验的新的、更快的方法的出现,故事不再局限于单一媒介,人们可以自由地构建共同线程流经各种界面和平台的世界。 ·空间叙事:在虚拟三维空间中进行空间设计和制作的基本要素。这个过程非常反复、耗时且昂贵。智能空间模型允许建筑师设计可视化的快速结构,但空间并不存在,重要的是,我们要了解生活、工作和团聚的历史。未来。工业与时尚设计师以直观的形式讲述想象,并探索与人性和空间互动的物体。 ·新的沉浸式体验和互动体验:体验是一种深刻的形式,是一种意义非凡的体验。纵观人类历史,只有一个三维世界:我们共同共享的物质世界。直到最近几十年,游戏和虚拟现实 (VR) 才刚刚出现,但我们才刚刚开始了解分享我们自己创造的另类世界意味着什么。空间智能现在与虚拟和增强现实 (XR) 耳机以及沉浸式显示器等新产品外形相结合,以前所未有的方式增强这些体验。我们正在走向一个未来,我们将能够像打开一本书一样自然地进入一个完全实现的多维世界。有了空间智能,世界构建不再是人类的专属领域工作室拥有专业的制作团队,但对个人创作者、教育工作者和任何有共同愿景的人开放。机器人技术:智能在实践中体现 从昆虫到人类,动物利用空间智能来理解、导航并与世界互动。机器人也不例外。自该领域诞生以来,空间感知机器一直是一个梦想,包括我自己与斯坦福研究所的学生和合作者的工作。这就是为什么我们对使用世界实验室正在构建的模型来实现这一目标的可能性感到如此兴奋。 ·利用世界模型扩大机器人学习:机器人学习的进步取决于可扩展且可行的训练数据解决方案。考虑到机器人需要学习理解、推理、计划和交互的各种可能状态,真正创造具有泛化能力的机器人需要结合互联网数据、综合模拟和捕捉真实的人类演示世界。许多人认为这是必要的。然而,就语言模型的推断而言,目前缺乏用于机器人研究的训练数据。世界模式在这里起着决定性的作用。随着感知保真度和计算效率的提高,世界模型的结果可以快速缩小模拟与现实之间的差距。这有助于训练机器人模拟各种条件、交互和环境。 · 同伴和合作者:作为人类合作者,机器人可以在迫切需要更多劳动力和生产力的领域扩大部分劳动力,无论是支持实验室的科学家还是帮助独居的老人。但这需要空间智能来感知、推理、计划和行动,同时与人类目标和行动同理心地保持一致,这是最重要的。例如,实验室机器人可以操作设备,让科学家可以专注于需要技能和推理的任务,同时在家协助tants可以帮助老年人准备饭菜,而不会影响他们的享受和独立性。为了实现这一目标,一个真正的空间智能世界模型至关重要,它可以预测下一个状态,甚至可以预测与此期望一致的行为。扩展实体形式:人形机器人在我们为自己构建的世界中发挥着作用。但创新的最大好处将来自更多样化的设计,包括输送药物的纳米机器人、在狭小空间导航的软机器人以及为深海和太空建造的机器。未来的空间智能模型,无论其形式如何,都需要整合这些机器人所居住的环境以及机器人本身的体现感。知识和运动。然而,开发这些机器人的一个主要挑战是缺乏这些不同具体形式的训练数据。世界模型在模拟数据、训练环境方面在这些努力中发挥着关键作用nts 和基准测试任务。更广阔的视野:科学、医学和教育 除了创意和机器人应用之外,空间智能的深远影响还延伸到人工智能可以通过拯救生命和加速发现来扩展人类能力的领域。 down, big 虽然我们将重点关注三个具有变革潜力的应用领域,但毫无疑问,空间智能用例在更多行业中具有深远的前景。在科学研究中,具有空间智能的系统可以模拟实验,并行测试假设,并探索人类无法到达的环境,从海洋深处到遥远的行星。这项技术有潜力改变气候科学和材料研究等领域的计算模型。通过将多维模拟与现实世界的数据收集相结合,这些工具可以降低计算阈值并扩大所有实验室可以观察和研究的范围站立。 ·在医疗保健领域,空间智能将重塑从实验室到医院病床的一切。在斯坦福大学,我的学生和合作者多年来一直在医院、疗养院和家里与患者一起工作。这次经历让我相信了空间智能的变革潜力。人工智能可以通过模拟多个维度的分子相互作用来加速药物发现,通过帮助放射科医生发现医学图像中的模式来改善诊断,并启用环境监测系统来支持患者和护理人员,而无需取代康复所需的人际关系。不用说,机器人可以在各种情况下为医护人员和患者提供帮助。在教育中,空间智能可以实现沉浸式学习,具体化抽象或复杂的概念,并创造对大脑和身体学习非常重要的重复体验。在人工智能时代,需要更快、更有效的学习和d 再培训对于学龄儿童和成人尤其重要。学生可以探索细胞机器并在多维空间中浏览历史事件。教师可以通过交互式环境使用个性化教学工具。从外科医生到工程师、专业人士,他们可以通过逼真的模拟安全地练习复杂的技能。所有这些领域都有无限的可能性,但目标是相同的。人工智能并没有取代人类的判断力、创造力和同理心,而是增强了人类的经验,加速了人类的发现,并增强了人类的注意力。过去的结论在过去的十年里,人工智能已经成为一种全球现象,成为技术、经济甚至地缘政治的转折点。但作为一名研究员、教育家和现在的企业家,最激励我的是75年前图灵问题背后的精神。我仍然和你一样好奇。这种好奇心驱使我每天挑战空间智能。第一次在他的理论上,我们可以希望制造出与物理世界如此协调的机器,以便我们可以将它们视为真正的合作伙伴来应对我们最严峻的挑战。无论是加速我们对实验室疾病的理解,还是在历史上发生的革命,以及我们最脆弱的时刻,还是在我们的生活中,在我们的技术中,在我们的生活中,在我们的生活中,在我们的生活中,在我们的生活中,这并不重要。这是一种更深刻、更丰富、更有力量的生活的愿景。卡西 500 百万年的自然灾害,是古代动物中太空智能的最初设计,工程技术的生成,很快就会成为现实,并成为人们的能力和未来人物的用途世界。如果没有空间智能,我们对真正智能机器的梦想是不完整的。 (辰辰)

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注