长江日报
长江日报 2024年07月30日 星期二
往期回顾
返回目录

“听”地震的“神兽”来了

我国发布首个亿级参数量地震波大模型

    7月28日,“谛听”地震波大模型在四川成都发布,该大模型由国家超级计算成都中心、中国地震局地球物理研究所以及清华大学联合开发,是首个亿级参数量的地震波大模型。

    国家超算成都中心常务副主任王建波介绍,“谛听”地震波大模型对于突破中小地震波模型性能瓶颈,提高地震大数据智能处理能力和信息挖掘水平具有重要意义,国家超算成都中心正不断加速人工智能技术在防灾减灾、智慧城市等领域的应用与发展。

    据了解,目前“谛听”地震波大模型已可投入使用,十亿参数量级的版本预计2024年8月完成预训练。未来,该大模型还可用于矿震监测、城市地下空间结构探测、海底地震监测等多个领域。

    ■ 如何练出听震“神兽”

    “‘谛听’原本是中国神话传说中的神兽,可以通过听音来辨认世间万物。”中国地震局地球物理研究所副所长陈石说,“我们研发的‘谛听’,是一种大型地震学数据集以及在此基础上训练的人工智能大模型。”

    发布会上,陈石如此解释“谛听”的来历:它们都是通过“听”去认识、分析自然界中的信息。

    陈石说,随着我国地震监测体系的持续优化升级以及近年来人工智能技术的迅猛发展,地震学研究和防震减灾工作也进入了地震波大数据时代,“谛听”地震波大模型应运而生。

    那如何训练这只可以辨识地震的“神兽”?

    首先要有数量足够的数据,这就是“谛听”数据集。最初,科研团队将2013年至2020年间的震相观测报告和国家测震台网数据备份中心的数据,经过清洗和脱敏处理后,建立了1.0版本的“谛听”数据集。随着数据规模的扩大,2023年9月,成都产业集团运营的国家超算成都中心与中国地震局地球物理研究所达成战略合作,双方合作共建“地震大模型创新应用联合实验室”,新一代“谛听”数据集正式落户成都。

    数据集是大模型训练的基础,数据集的规模和质量直接决定了模型的训练效果。目前,“谛听”数据集不仅是国内首个,同时也是目前国内外最大规模、样本类型和标注最为全面的地震学专业AI训练数据集之一。

    其次,是算法、模型的设计和调优。来自清华大学自动化系的助理研究员刘畅博士介绍,作为全球范围内地震波大模型的首次探索,需要进行大量基础性研究,否则模型训练不充分,实际应用效果不及预期。

    简单来说,算法的选择和设计直接决定了模型的学习能力和表达能力,算法的优化和改进可以提高模型的性能和效果。参数则是大模型训练的调节器,可直接影响模型的准确性和稳定性。在“谛听”大模型中,参数的数量非常庞大,也给最优参数的确认造成极大的挑战。

    “人工智能算法的关键在于两个因素,训练数据量和模型参数量。”陈石用比喻来解释:训练数据量可以看作是算法的“阅历”,而参数量则是算法的“脑容量”。要想有效地记忆和理解海量的地震数据,并充分挖掘和利用其中的信息,就必须发展与之相匹配的大“脑容量”的大模型。

    ■ “谛听”都能干什么

    陈石谈道,“谛听”地震波大模型依托中国地震台网的海量数据,通过先进的人工智能技术,在测试中发现,可以显著提升地震信号的识别准确率和速度。

    因此,从短期看,“谛听”地震波大模型可直接应用于地震信号识别、地震活动监测、大地震快速响应等领域,有望减轻地震局一线业务人员的工作压力。从长期看,地震学是一门观测科学,重大的突破往往来自对观测数据的深刻理解。对观测的理解越全面,对观测的整合能力越强,离地震学科学问题的突破就越近。

    从应用领域看,“谛听”地震波大模型的前景也十分令人期待。“未来,该模型的应用场景还可用于矿震监测、页岩气开采、城市地下空间结构探测、海底地震监测等多个领域。”王建波说。

    以寻找油气为例。目前全球95%以上的油气田发现主要是依靠地震勘探。王建波说,地震波在不同介质中传播时,强度、形态等特征都不同,“谛听”地震波大模型通过学习储存石油区域的波形特点,就可以推导出地下是否含有油气。

    陈石表示,第一版“谛听”地震波大模型完成了从预训练到微调完整流程的从无到有的探索,初步展示了优于中小模型的性能,为后续充分挖掘和发挥地震波大模型的优势探索了道路,积累了经验。

    综合新华社、《四川日报》报道