长江日报
长江日报 2025年01月03日 星期五
往期回顾
返回目录

不止于车企,理想要做全球领先的人工智能企业

    理想汽车董事长兼CEO李想

    车位到车位行业领先真全场景无断点。

    “连接物理世界和数字世界,成为全球领先的人工智能企业。”12月25日—27日,理想汽车在“2024理想 AI Talk”活动中,正式宣布了新的愿景,分享了对人工智能的最新思考,以及包含智能驾驶和理想同学在内的人工智能技术的最新进展,同时基于自研基座大模型Mind GPT的理想同学已从车机进入手机,目前App已上线。

    这一转变不仅是对传统汽车行业的一次重大跨越,更是理想汽车对未来出行方式深刻理解的结果。理想汽车董事长兼CEO李想表示:“电动化是上半场,智能化是下半场,但我认为,这个智能化讲的不是传统的软件智能,而是真正的人工智能,这是造车往下延续的一个必经之路。”

    ■ 每年超100亿元研发资金

    近一半用于人工智能

    “从企业角度而言,我们要做的不是汽车的智能化,而是人工智能的汽车化,并将推动人工智能普惠到每一个家庭。从行业视角来看,汽车将从工业时代的交通工具,进化成为人工智能时代的空间机器人。在对整个世界的理解上,我们通过人工智能将物理世界与数字世界进行融合,让有限的空间实现无限的延伸。”李想如是说。

    早在2022年9月,理想汽车就已经确定了要将人工智能作为公司未来发展的重要方向,并视之为未来竞争的关键。到了2023年初,随着ChatGPT的诞生,理想汽车更加坚定了这一战略选择,将其从隐藏的战略转变为公开的目标。

    为了实现这一宏伟目标,理想汽车已经在人工智能领域投入了大量的资源。公司每年超过100亿元的研发投入中,接近一半聚焦于人工智能,并建立了四支专门的AI团队来解决智能驾驶、理想同学、智能商业、智能工业等领域的不同问题。这些团队不仅致力于自动驾驶技术的发展,还在探索如何将认知智能与空间智能相结合,形成更强大的VLA(Vision Language Action Model,视觉语言行动模型)。

    此外,理想汽车还发布了三阶段的战略路线图,以实现AGI(通用人工智能)。第一阶段称为“增强我的能力”,即AI能够显著提升人类的工作效率和便捷性,但还需要人类兜底;第二阶段叫作“成为我的助手”,AI将推进至L4级别的自动驾驶与Agent阶段的理想同学,用户可以简单指示车辆完成任务;第三阶段升级为“成为我的硅基家人”,AI能够延续并运用人类的记忆,自主做出决策,并主动执行多项任务,成为家庭的重要成员。

    为了更好地支持这些目标,理想汽车推出了多个关键技术和服务。例如,Mind GPT已经迭代了30多次,未来将在OTA 7.0更新中进入到第三阶段,即Mind GPT-3o,进一步发展任务助手、认知成长和情感陪伴能力。

    ■ 智能助手理想同学App上线

    随时随地陪伴你的智能助手

    随着理想的愿景升级,理想同学App也应运而生,这款基于自研的基座大模型Mind GPT的应用程序于2024年12月27日全量上线,标志着理想同学从车机进入手机的战略性一步。“我们希望可以让理想汽车的100多万用户,再加上这些用户的家庭,大概300万—500万的人,不仅可以在车上,还可以在手机、电脑,甚至后边还可以在眼镜上,都体验到一致的人工智能产品。” 李想说道。

    理想同学App具备两大核心功能:“知识问答”提供多领域的问答能力,包括汽车、出行、财经、科技等领域;“看世界”则依靠视觉感知能力帮助用户识别菜单、画作、动植物等上千种通用物品。此外,该应用程序还支持撰写文章、翻译和创作文案等多种文本任务,为用户提供全方位的帮助和支持。

    更重要的是,理想同学不仅仅是一个简单的问答工具,它更像是一位能够理解用户需求并主动提供帮助的朋友。理想汽车智能空间AI负责人陈伟说:“我们的重心是希望能够实现从L1 ChatBot(聊天机器人)到L2(推理者)的变化。我们定义L1有两个核心的特点,第一个是能够实现多模态,因为人就是能听会看的,所以我们认为语音和视觉加入到大模型是非常关键的。第二个是指令遵循的能力,能够听得懂人在跟它讲什么,再复杂的命令也能听得懂,并且能够比较准确地执行。”

    理想同学App的推出,离不开背后强大的技术支持。与前两代侧重语言模型不同,Mind GPT-3o将通过构建融合感知和认知的多模态端到端大模型能力,大幅降低人机交互延迟,使得人机交互更加自然流畅。目前,Mind GPT的预训练数据规模已达10万亿Token,涵盖了自动驾驶、对话等场景中特有的多模态数据。

    不仅如此,理想同学App还特别关注用户体验的连续性和一致性。理想汽车希望通过持续的技术创新,让用户在不同的设备上都能享受到同样优质的服务。李想强调:“长远来看,在掌握基座模型前提下的一个真正的大模型产品一定能够去自主使用所有的设备,会拥有所有的服务,这才是真正的人工智能。”

    为了确保理想同学App能够在各个平台上顺利运行,理想汽车投入了大量资源进行优化。Mind GPT的每一次迭代都经过严格测试,确保其在不同设备上的表现稳定可靠。此外,理想汽车还建立了完善的数据闭环机制,通过不断收集用户反馈,快速调整和优化模型性能,以满足用户的多样化需求。

    ■ L3有监督智能驾驶

    迈向L4自动驾驶的重要一步

    在自动驾驶领域,理想汽车同样取得了令人瞩目的进展,计划于2025年实现L3有监督智能驾驶,并逐步提升至L4高度自动驾驶水平。

    为了达成这一目标,理想汽车推出了创新的“高速端到端”及“AI推理可视化”交互功能。其中,“高速端到端”实现了高速特殊场景NOA不降级、不断点、更连续的功能,使理想汽车成为国内唯一一家、全球第二家将端到端技术应用于高速(及环路)NOA场景的车企。这不仅提升了用户体验,还显著提高了行车安全性。

    同时,“AI推理可视化”通过展示10种可能的策略轨迹并实时选出最佳方案,帮助驾驶员更好地理解AI决策逻辑。理想汽车智能驾驶研发负责人郎咸朋回忆起第一次试驾端到端时的感受:“我从中关村开到了北京交通大学,开了几公里我就问旁边的同事,这是规则还是怎么做的?怎么我觉得开得这么好呢?他说一句规则都没写,全都是系统按照咱们给它的数据自己训练出来的。”

    安全始终是理想汽车关注的重中之重。尽管取消了角毫米波雷达,转而采用以纯视觉为主的技术路线,但理想汽车仍保留了激光雷达作为“安全带”。李想特别提到:“在中国晚上夜路开车,你会看到有尾灯坏了的大货车,甚至可能尾灯坏了的大货车会直接停在主路上。但是激光雷达,在没有任何光线的情况下是可以看到200米的。”

    理想汽车的智能驾驶方案不仅注重技术创新,更强调用户体验。郎咸朋指出:“当你把自动驾驶当成能力来开发,从最本质思考人是怎么学会开车的……我们会让用户看到端到端的工作方式是什么样的,视觉语言模型工作方式是什么样的,以及人工智能到底是怎么工作的。”

    为了实现L3有监督智能驾驶,理想汽车需要积累大量的高质量数据。截至12月25日,理想汽车智驾总里程已达29亿公里,训练算力提升至8.1EFLOPS。这样的数据积累为模型训练提供了坚实的基础,使得理想汽车能够在短时间内迅速迭代并优化自动驾驶系统。“我们通过持续的OTA升级,为用户提供了行业领先的安全能力,包括全自动紧急转向AES(自动紧急转向)、全速域无上限激活AEB(自动紧急制动),以及城市路口多方向人车混行场景AEB等。”李想说。

    展望未来,理想汽车将继续致力于推动人工智能技术的发展,努力实现AGI(通用人工智能),并将其应用于更多领域,为用户创造更加便捷、智能的生活体验。

    “理想汽车将始终把用户价值放在第一位,秉持‘超越用户的需求,创造让我们自豪的产品和服务’的企业价值观,为更多用户创造移动的家、创造幸福的家。”李想说,“未来,理想汽车将逐步从智能电动车企业升维转型为人工智能企业。”