
《第三种存在:从通用智能到超级智能》
朱嘉明 著
中译出版社
《第三种存在:从通用智能到超级智能》这本书中表达了这样的观点:作者认为数千年的人类文明,基于两种存在。第一种是物理性和物质的存在;第二种是精神和意识的存在。2022年之后,因为人工智能和神经网络的结合、深度学习的突破、大语言模型的出现和应用,人工智能可以处理自然语言、知识表示、合理思考、自动推理,像人一样行动,成为同时具备精神和物理特征的第三种存在。人工智能所创造的第三种存在,是“人工智能+人+环境”的复杂生态系统。人工智能和人类、人类社会、自然界互为“嵌入”关系。
书中聚焦大模型和大模型应用,以及具身智能作为新物种崛起的意义和未来发展趋势,前瞻性地分析人工智能对传统经济学的影响和改变,以及人工智能对经济、金融、区域发展、城市化,特别是教育的冲击和改造。另外,作者从人文艺术的角度探讨人工智能对人类本身的重新塑造。作者呼吁强化人工智能治理的国际社会合作,避免人工智能被资本裹挟和自然垄断的恶化。
【书摘】
■ 通过人工智能,人类可创造多元时空
人工智能是一种智慧存在,也是一种物理存在。不仅如此,人工智能还具有创造物理世界的能力。
2024年初,Open AI推出作为“物理世界模拟器”的Sora模型。Sora具有深刻“理解”运动中的物理世界的能力,在不违反物理世界常见规律,例如重力、光电、碰撞等的前提下,内置光照、碰撞、动画、刚体、材质、音频、光电等各种数学模型,最终生成在相当长时空范围内的视频,构建和呈现真正的世界模型。
在Sora实现物理世界的过程中,不仅要符合人类思维逻辑推理等“规律”(统称思维逻辑),不违反常识,分析归纳,前后自洽,还要符合物理世界“规律”,例如能量守恒定律、热力学定律、力的相互作用定律等。于是Sora提供一个逼真且满足人类思维规律和“物理规律”的数字世界,就是第三种存在的一种形态。
到了2024年12月,World Labs发布了一个从单一图像生成交互式3D场景的革命性技术。World Labs联合创始人贾斯汀·约翰逊(Justin Johnson)对该技术的描述是:基于一张图片或一个片段,创造一个完全模拟的和互动的3D世界。也就是说,人类可以通过人工智能生成3D物理世界,物理世界由此得以扩展。
2025年1月7日,英伟达创始人黄仁勋(Jensen Huang)在2025年拉斯维加斯消费电子展(CES)发布Cosmos世界模型(Cosmos World Foundation Models,简称Cosmos WFMs)。该模型经过了9000万亿个token的训练,数据来自2000万小时的真实世界人类互动、环境、工业、机器人和驾驶数据。该模型通过文本、图像和视频等输入以及机器人传感器或运动数据的组合中生成具有“物理感知”的视频,超越数据,让人工智能真正理解物理规律,完美模拟物理世界,实现人类的潜意识推理,加速通用机器人的广泛应用,包括工业仿真、自动驾驶、机器狗、仿真数据生成等场景,推动智能科技和物理人工智能的民主化。世界模型被视为下一个重大突破。
进一步,人类通过人工智能技术可以改变牛顿的一元经典时空、创造具有相对论意义的多元时空。因为只有人工智能可以直接证明:存在之间一切作用(实现)效度都是(实现的)信息与主体相关项的比值,而公因内容无意义。因为,人工智能体系具有接受多元主体的空间,且“主体之间可建构集合关系,主体之间不可替代”。换一种表达方式,人工智能框架在不排斥牛顿定律的同时,还可以容纳和证明相对论。
人工智能的技术演进,不可避免地发生与扩展现实(extended reality,ER)技术的结合。虚拟现实(virtualreality,VR)与增强现实(augmented reality,AR)技术可以打破物理空间限制。人们可以通过穿戴设备置身于虚拟环境中,或将虚拟信息叠加到现实世界中实现虚拟与现实间的系统互动;还可以借助混合现实(mixed reality MR)技术,通过结合虚拟现实和增强现实,创建现实世界和虚拟世界的无缝连接和操作。
2024年8月,中国游戏行业推出的《黑神话:悟空》,在人工智能技术的助力下,实现了场景与角色的高度互动,完成了视觉与体验的革命,证明了人工智能技术可以重新塑造人类的生活方式。
■ 人工智能和人类、自然社会互为“嵌入”
人类正在进入这样的历史阶段:一方面要面对“自然实在”的所谓物理世界;另一方面在物理空间的“后面”,存在着更为丰富的虚拟世界。或者说,物理世界和虚拟世界都是世界存在的状态,既是平行的,又有可能是联通的,甚至是一体的。通过扩展现实技术实现的虚拟世界,或者元宇宙,也是第三种存在的一种形态。
人工智能作为第三种存在,其最令人困惑、备受争议的问题无疑是它是否思考和如何思考。进而,人工智能是否具有近似人类的内心世界。根据麻省理工学院(MIT)计算机科学与人工智能实验室(Computer Science and Artificial Intelligence Laboratory,CSAIL)科学家对这一问题的研究发现:至少LLM(大语言模型)可能会为了提高生成能力,而发展出它们自己对现实的理解。
该团队开发了一组小型卡雷尔谜题(Karel Puzzle),包括生成一些在模拟环境中控制机器人的指令。他们针对谜题训练LLM,但并未向模型展示那些解决方案的实际工作原理。实验开始时,模型生成的随机指令并不正确;训练完成时,指令的正确率已达到92.4%。这可能意味着,如果模型能以如此高的准确率完成一项任务,也许它可以理解语言中的含义了。他们用了一种名为“探测”(probing)的机器学习技术,查看模型在生成新的解决方案时的“思考过程”。
人工智能所创造的第三种存在,说到底是“人工智能+人+环境”的复杂生态系统。人工智能和人类、人类社会、自然界互为“嵌入”关系。它包括如下的子系统,或者交互系统:人工智能与人类思维活动和经济社会互动的交互系统;人工智能之间的交互系统;人工智能与包括人工智能改变的环境所形成的交互系统;人工智能与自然生态的交互系统;人工智能与真实世界和虚拟世界的交互系统。
简言之,一方面,人工智能形成与既定生态的互动关系;另一方面,人工智能参与环境的改变,其无限生成力最终成为环境的组成部分。例如,当未来的数十万、数百万、数千万的智能机器人走入人类社会,其数量和质量都超过人类,人类和机器人的彼此关系发生了根本性的调整,人工智能机器人构成了新生态的主要组成部分,最终演变出日趋复杂的“人工智能+人+环境”的生态系统。
(长江日报记者马梦娅 整理)