海洋领域中的大模型综述
海洋系统具有多尺度、非线性和时空耦合特性,其行为受复杂流体力学和边界条件驱动。传统数值模拟(Numerical Weather Prediction, NWP)将观测数据同化到网格中求解动力学方程,已成为气象与海洋预报的主要范式[1]。然而,这种范式面临数据同化规模庞大、动力学模式参数的不确定性以及计算成本高等“三大挑战”[2]。随着深度学习技术的发展,人工智能(AI)被提出来破解这些瓶颈:利用海量卫星与实测数据,神经网络可实现更快速的场重建、异常现象识别和中长期预报等任务,其预报精度在许多场合已与传统数值模式相当甚至优于后者[3][4]。例如,FourCastNet利用一种基于傅里叶神经算子的Transformer网络,可在0.25°分辨率下完成全球天气预报,其结果在大尺度和短时程预报上已达到甚至超过欧洲中⼼[5];类似地,GraphCast等AI模型在多达10天的全球预报上精度和效率均超过ECMWF模式[7]。尽管如此,纯数据驱动方法缺乏物理守恒约束和可解释性,对未知极端情景的鲁棒性仍显不足[6][7]。由此,海洋科学界正探索将基础模型(foundation model)方法引入海洋领域,以期结合AI的表达能力和物理知识,创建端到端、多任务、可泛化的海洋科学工具。
1. 引言
海洋过程与大气类似,是一个由流体方程(Navier–Stokes等)描述的高维复杂系统,具有湍流、对流、地转流等多种动力学过程。传统海洋模式(如HYCOM、ROMS等)依赖数值积分PDE、参数化亚格尺度过程,并结合数据同化(如集合卡尔曼滤波EnKF、四维变分4DVar等)来更新初始场[8][1]。这一范式虽然在实际预报中取得了巨大成功,但也存在固有局限:首先,同化技术在海量、多模态观测面前处理能力有限,尤其是多源卫星数据的异构性和高时空分辨率提出了新的挑战[2];其次,物理模式对亚网格过程的模拟存在系统偏差,这导致长期演化中出现偏差积累;再次,高分辨率预报需要庞大的计算资源,这限制了数值模式的进一步细化及多组分耦合模拟的发展[2]。因此,人工智能方法开始被视为一种潜在补充或替代方案。通过直接学习从观测到未来场的映射,深度神经网络有望在计算效率上远超传统模式,同时利用大数据自动提取复杂关联。这些AI模型可以在保留精度的同时,以不到传统模式千分之一的计算资源,实现快速预报[7][9]。
近年来,生成式AI和基础模型在语言和视觉领域的突破也启发了地球科学界对其在海洋中的应用兴趣。基础模型通常是在大规模数据集上预训练的大型神经网络,经过微调可适配多种下游任务[10]。例如,Bommasani等(2021)将BERT、GPT-3、CLIP等称为“基础模型”,指出它们在多个任务中展现出新的全局能力[18]。类似地,海洋领域出现了首批“海洋GPT”这样的大模型(Bi等,2023)[10]。这些模型借鉴了通用基础模型技术,期望在海洋科学任务(如资料查询、报告撰写、事件预测)中表现出通用性。本综述以历史文献为依据,回顾海洋科学与智能航运中AI及基础模型的研究进展:从方法演变到模型体系再到应用领域,并对关键挑战与未来方向提出分析。
2.方法演进
海洋建模方法经历了从传统数值模型到数据驱动智能模型的持续演进,主要包括数值模型、数据同化、深度学习、Transformer、神经算子以及基础模型等阶段。该演进过程体现了海洋建模由物理机理主导逐步走向数据驱动与物理融合并行的发展趋势,同时也揭示了计算效率提升与物理一致性保持之间的权衡关系(图1)。

图1 海洋建模方法演进路径
Figure 1. Evolution of Methods for Ocean Modeling
2.1 传统数值模式与数据同化
海洋预测一直依赖于基于流体方程的数值模式。如海洋通用环流模式(NEMO)或混合坐标模式(HYCOM)等通过求解Navier–Stokes方程组来模拟洋流和温度盐度演变[8]。这些模式结合数据同化(4DVar、EnKF等)使用卫星SSH、SST、观测浮标等多源数据来校正初始场。该范式可生成物理一致的预报场,但有明显的劣势:① 模式分辨率提升带来计算成本呈指数增长,难以实时应用;② 同化系统的背景误差协方差需要复杂标定,同化非线性强且对模型偏差敏感;③ 亚格尺度过程(如湍流、混合过程)依赖经验参数化,难以准确模拟。当面对海量、异构观测(如高频鸟瞰图像、物理剖面等)时,传统同化框架扩展困难[2]。为此,人们研究了混合同化方法(如集合-变分混合En-4DVar)和机器学习辅助同化策略,但其核心仍基于数值模拟误差修正。
2.2 深度学习方法(CNN/RNN等)
近年来,卷积神经网络(CNN)、递归神经网络(RNN)等深度学习模型逐渐应用于海洋时空数据的建模。例如,Xie等(2024)利用3D U-Net模型融合海表温度等多源资料,实现了高精度的海表温度和热浪预测;Ren等(2024)采用多尺度U-Net进行海表温度短期预报;也有学者提出从海表温度推断分层温度场的神经网络模型。这些工作表明,CNN等架构能有效捕捉海表或剖面数据的空间特征,进行短期预报或异常检测。然而,基于CNN的模型通常需要固定输入分辨率,缺乏对变化分辨率的泛化能力;对于多变量耦合预报,通常采用多分支或联合训练,但模型可扩展性受限。此外,CNN与RNN等方法在捕捉长程依赖上存在困难,不同时间尺度的捕捉也需要特别设计(如变种RNN或时序卷积)。
2.3 Transformer 及其在气象/海洋中的应用
Transformer架构最早由Vaswani等(2017)提出[3]。其核心是基于自注意力机制,能够捕获任意位置间的依赖关系。在气象与海洋预报中,Transformer通过引入空间-时间注意力或在经向纬度上进行卷积,实现了对高度非线性演化的建模。例如,FourCastNet[5]在资料充足的背景下,将全球大气场切分为块,并通过Adaptive Fourier Neural Operator(AFNO)提取频域特征,用极高速度生成1周天气预报。实验结果显示,FourCastNet在整体指标上优于ECMWF IFS模式,尤其对小尺度扰动的预报精度更高[5]。GraphCast(Lam等2023)使用图神经网络和卷积相结合的Transformer模型,也在10天预报时段上超越高分辨率模式[7]。尽管上述工作主要针对大气,海洋领域也开始出现高分辨率数据驱动模型。例如,Wang等(2024)提出了 XiHe 模型,这是一种面向全球海洋涡旋解析预报的分层 Transformer 框架,能够在保持较高精度的同时显著提升预报效率。目前Transformer类方法在捕获长时程关联方面潜力巨大,但对于海洋特有的物理约束和数据稀疏性仍需进一步研究。
2.4 物理信息与神经算子
物理信息神经网络(Physics-Informed Neural Networks, PINN)由Raissi等于2019年提出[4]。这类网络将偏微分方程约束融入损失函数,用于求解PDE问题并可处理反问题。但PINN对多变量、高维海洋场的直接预测有一定难度。另一类方法是神经算子,特别是傅里叶神经算子(FNO)[2]。Li等(2020)提出的FNO可直接学习从参数场到PDE解的映射,尤其能在不同网格分辨率间实现较好的泛化,其效率在湍流流动模拟中高出传统求解器数百倍[2]。FourCastNet使用的AFNO即为FNO的一种变体。最近研究将FNO应用于海洋预报:例如Xu等(2025)构建了用于三维温度、盐度和流场同时预报的FNO模型,在南海真实数据集上对比数值模式,平均RMSE降低了43%[8];Chattopadhyay等(2024)的OceanNet则将FNO与多步修正机制结合,实现了墨西哥湾强涡流区的年度尺度预测,预报性能与传统高分辨率模型相当,但计算成本降低了约50万倍[9]。这些成功案例表明,神经算子在处理多尺度海洋数据方面优势明显,但其长期稳定性和物理约束需要通过新的正则化方法(如Chattopadhyay等引入的谱正则化[9])来强化。
3. 海洋相关基础模型体系
在基础模型的范式下,我们可以构想一个面向海洋的多层次模型架构(图2)。海洋基础模型框架由数据层、模型层和应用层构成。数据层包括卫星遥感、浮标/Argo观测和再分析资料等多源海洋数据;模型层涵盖数值模型、深度学习、Transformer、神经算子及基础模型等主要技术范式;应用层则面向海洋预测、智能航运、数据同化与遥感解译等典型任务。该框架刻画了海洋智能由多源感知到模型建构再到任务落地的基本逻辑。

图2 海洋基础模型总体框架
Figure 2. Framework of Ocean Foundation Models
其中,模型层是核心:该层包括多种类型的预训练“基础模型”,例如:
·大语言模型(LLM):近年来出现了领域专用的海洋LLM。Bi等(2023)构建了“OceanGPT”,宣称这是首个专门面向海洋科学的大型语言模型[10]。OceanGPT经过大规模海洋文献和数据训练,可回答与海洋学、航运等相关的问题,并生成科普或科研文本。此外,还有如 OceanAI(Chen等,2025)将通用LLM与实时海洋数据接口结合,在回答查询时引用真实数据[11]。这些LLM可承担知识检索、报告撰写、决策支持等语言任务,但仍受限于训练数据规模和领域覆盖,容易产生“幻觉”答案。
·多模态模型:海洋基础模型应处理卫星遥感、传感器时间序列与文本等异构数据。当前已有模型如ORCAst[14]通过多阶段神经网络融合SSH、SST、叶绿素等影像数据进行流场预测。但未来可借鉴通用视觉-语言模型(如CLIP[10]、Segment Anything等)来开发海洋多模态基础模型,实现从卫星图像自动识别海洋现象。OceanAI还探索了将自然语言与网格型数据(JSON/CSV/NetCDF)相结合的“视觉+语言”查询机制[21]。
·时空预测模型:基于Transformer的时空模型在气象预报中已验证了威力(如FourCastNet[5]、GraphCast[7])。对于海洋,可构造类似模型:例如在四维流场上使用自注意力机制处理时间序列,也可将海图划分区域并应用图神经网络(GraphCast的思路)。此外,混合物理-学习模型(Physics-guided Transformers)或耦合模型,也是一条前沿方向。
·神经算子与物理信息模型:正如第2节所述,Fourier神经算子和PINN为模型层提供物理一致的网络结构。它们可以作为基础模型的一部分,例如预训练海洋动力学算子,并在下游任务中微调。OceanNet等工作已显示,通过在预训练阶段约束海洋物理,可以显著提升模型稳定性[9]。未来的统一架构可将这些模块化网络整合,如图2所示,将物理算子嵌入到Transformer中,或将物理层次嵌入LLM,以实现物理-数据的协同预测。
4. 主要应用场景
4.1 智能航运与路径优化
海洋人工智能在航运路线规划和能效优化上有着直接应用价值。传统的航线选择往往基于经验或确定性算法,难以实时适应海洋天气变化。近期研究展示了深度学习在航运中的创新应用:例如Hazarika等(2024)提出了SWR-Viz可视分析框架,将FNO预测的短期波浪场与可交互的路径规划模型(SIMROUTE)结合[12]。SWR-Viz能根据船舶当前位置和实时波浪预报进行交互式航线优化,实时可视化燃油排放和风险指标,显著提升了航行稳定性。另有研究以强化学习为核心:Bora等(2026)提出Pier系统,通过离线强化学习生成物理约束的航线策略。实验结果表明,与传统大圆航线相比,Pier平均CO₂排放减少约10%,更重要的是在极端气象航次中最差百次排放量降低70%[13]。这表明,结合AIS轨迹数据和再分析场,AI方法可以学习到避免危险天气的策略。总体来看,AI方法正在使航运决策智能化、碳减排和安全性同步提高。
4.2 海洋环境预测
海洋环境预测包括洋流、波浪、海温、海面高度等变量的预报。海流预报方面,Garcia等(2025)提出了ORCAst框架:一个端到端神经网络模型,仅以多源观测(浮标、航天遥感数据)为训练数据,通过多阶段训练实现高精度海面流场预报[14]。该模型无需地转近似,能同时输出SSH和U/V流速分量,对全球海洋外推7天以上时,显著优于延迟发布的常规数据产品(如DUACS)和近实时数值模式[23][28]。同时,Xu等(2025)基于FNO设计了三维海温、盐度与流场的联合预报模型,在一个月级南海测试中,其1–3天预报精度较U-Net提高了20%以上,与Copernicus营运产品相比RMSE平均降低43%[8]。在海洋波浪与天气交互方面,SWR-Viz已示范了基于ML的波浪场预报可用于船舶决策;类似地,也有工作用卷积神经网络处理风浪场实况,预测沿岸风暴潮。深度学习已在海洋内部波、涡旋检测以及风暴潮预测中表现出色。随着全球海表高分辨率数据的积累(如SWOT卫星等),更强大的ML模型有潜力提供更精细的海洋预报。
4.3 数据同化与多源融合
在数据同化与融合方面,人工智能可以辅助或重构传统同化流程。例如,Chen等的OceanAI系统并不直接求解动态方程,而是通过自然语言查询获取实时海洋产品数据,有效地实现了数据查找和整合[11]。另外,Hazarika等(SWR-Viz)提到其框架支持“与稀疏观测的数据同化”[12]。较进一步的是混合方法:如WCDA(加权耦合数据同化)即通过神经网络学习从海洋生态到物理场的联系[31]。尽管目前真正由AI完成的同化案例还很少,但随着AI建模能力提升,可以预见未来会出现以神经网络学习背景误差协方差或直接进行滤波预测的新方法。多源数据融合方面,深度学习技术已被用于遥感影像目标检测和提取。例如,Zhang等(2020)综述指出,深度学习在识别海洋遥感影像中的内波、涡旋、溢油、海冰等方面具有显著优势,远超传统算法[15]。类似地,卷积网络可将多频段卫星图像与海温、盐度和叶绿素观测结合,生成完备的环境场。例如Martin等(2023)等工作利用卫星SSH和SST联合进行延迟时间的海流插值。未来的大模型或可内置这些多源融合能力,在同一框架中融合遥感、浮标、无人船和文本报告等多种数据,实现更强鲁棒的场估计。
4.4 海洋遥感解译
海洋遥感(包括红外、微波、SAR等影像)生成了海表温度、叶绿素、风场以及电磁散射截面等丰富数据。AI方法在遥感解译中发挥了重要作用:如基于深度神经网络的分类与分割,可自动标记海表浮标、航迹、升温斑点等特征。例如,针对卫星雷达图像,神经网络可检测海冰边界和近岸溢油;针对可见光/红外图像,则可识别赤潮、海流涡旋等动态过程。在这些任务中,深度学习不需要显式物理模型即可提取特征,大幅加速了遥感解译流程。未来,多模态基础模型还可将遥感影像与文本信息结合——例如,整合卫星时序影像与海洋学文献(如气象预报日志)共同学习,提升综合分析能力。
海洋人工智能模型已广泛应用于气候与海洋环境预测、海上安全与智能导航、渔业资源管理、海洋生态监测、海上能源开发以及海洋资源勘探等领域。不同应用场景在近岸、外海和深海区域具有不同的任务需求和技术侧重点,体现了海洋人工智能从科学认知到工程应用的多层次拓展(图3)。

图3 海洋人工智能模型的应用场景分布
Figure 3. Application Domains of Ocean AI Models
5. 关键挑战
尽管上述研究展现了AI在海洋科学中的巨大潜力,仍存在诸多挑战:
·数据质量与多样性:海洋观测数据虽丰富,但存在时空覆盖不均、标签稀缺等问题。许多海洋事件(如极端涡旋)样本极少,导致数据驱动模型难以泛化。异构数据融合(卫星、浮标、模型等)需要复杂的预处理和对齐方法。
·物理一致性与可解释性:大多数纯ML模型缺乏物理约束,容易产生不符合守恒规律的结果。例如,在长时间积分中,模型可能出现“频谱偏置”(spectral bias),导致能量异常增加。此外,“黑箱”性质使得模型输出难以被领域专家解释和信任。这限制了AI方法在需要透明决策(如环境风险评估)的应用。对此,需要开发物理引导(physics-informed)结构或引入不变量损失来保证模型的物理合理性。
·泛化能力与极端场景:当前AI模型通常在特定区域或时间尺度下训练,对其他区域或气候条件下的泛化能力有限。文献中亦指出,大型模型在训练分布之外的“未知天气”情况下表现不确定。例如Pier模型显示其表现对标准大圆路线而言并未提高,而是在极端情形下大幅降低燃料浪费。这意味着AI模型需要在多变条件下进行鲁棒性测试和跨场景微调。
·计算与工程部署:尽管AI推理速度快,但训练阶段往往需要巨大的算力和数据存储。海洋基础模型所需的参数量和训练数据量可能达到类似语言模型的规模,普通研究机构难以承载。此外,模型部署到船载或实地环境中需考虑实时性、通信和能耗等工程问题,这在现有文献中尚未充分讨论。
·信任与安全:对于涉及人命安全的应用(如沿海预警、航运决策),AI系统的可验证性和安全性至关重要。现有通用LLM回答问题易产生与训练数据不符的“幻觉”答案。OceanAI等工作通过检索实时数据库缓解了这一问题,但对于自主生成模型,仍需进一步研究保证输出可靠性的机制。
6. 讨论
综上所述,当前海洋大模型研究呈现以下趋势:一方面,各类方法均在追求更高精度和效率,但共性问题也逐渐显现。例如,所有深度学习方法在数据匮乏和物理一致性方面需要协调;Transformer和神经算子虽结构先进,但需大量高质量数据才能发挥优势。此外,不同技术路线(纯数据驱动 vs. 物理驱动)各有偏重:前者强调快速学习和预测能力,但可能牺牲部分物理真实性;后者保证物理基础,但计算开销大且难以适应复杂环境。值得注意的是,一些方向可能被过度乐观评估,如完全依赖LLM来解决海洋科学问题,忽视了多模态数据的融合和物理知识;而物理方法有时被低估,如PINN尽管计算昂贵,但在合并观测和方程信息方面具有独特价值。
当前研究亟需构建统一框架来对比不同方法。就像大气-气候领域已有模型竞赛和“基准任务”,海洋学界也需要类似的社区数据集和评测指标,推动模型互评(例如OceanBench之类项目)。此外,将AI与海洋工程、航海实践相结合(如与自动驾驶船舶系统配合)是未来价值增长点。综述指出,尽管AI在概念上为“工具”,其更深层次的意义在于成为范式转变的一部分——未来的海洋科学可能由自动化数据驱动系统与专家协作完成。
7. 结论与展望
海洋领域的大模型研究才刚刚起步。未来,我们预计将出现更加统一的海洋智能框架:一个涵盖全球洋流、海冰、大气交互、生态系统等多物理场景的综合模型。例如Bodnar等(2025)发布的“Aurora”模型就是一个初步尝试,它训练了包含海洋波浪和大气在内的多类型数据,对空气质量、热带风暴轨迹等预测能力优于传统系统。该统一框架将数据驱动人工智能与物理引导建模有机结合,构建面向海洋环境预测、智能航运作业和海洋资源管理的闭环海洋智能系统。通过多模态数据集成、跨领域学习以及人机协同,该框架展示了海洋智能从数据感知、模型推理到决策支持的整体演进方向,为构建鲁棒、可解释且可持续的海洋智能系统提供了理论参考(图4)。

图4 面向海洋智能的统一框架
Figure 4. Unified Framework for Ocean Intelligence
类似地,未来的海洋基础模型(如“OceanGPT 2.0”)可能具备:一是对多模态数据(卫星、剖面、遥测、文本)的端到端学习能力;二是能自动符合物理守恒和边界条件;三是通过微调适应不同任务——从航运决策到海洋灾害预警。例如,一个海洋基础模型可被微调用于某海域的生态预报或救灾指挥,发挥基础模型的“预训练+微调”优势。此外,AI技术的发展也可能催生新的应用场景,如自动驾驶船舶与基础模型的闭环交互,或者基于AI的海洋“智能感知网络”对海况进行全局监测。
总的来说,海洋大模型研究价值在于将数据驱动和物理模型优势融合,提供更加灵活高效的预报与决策支持工具。当前的工作重点在证明AI技术的可行性,并为传统领域带来新思路;未来挑战则在于建立可扩展的生态体系(包括算法、算力和标准)和增强模型的可靠性。随着计算资源和海洋观测能力的持续增强,我们有望在未来十年见证海洋基础模型从研究原型走向实用系统,为应对海洋气候变化、航运安全和环境保护提供强大支撑。
参考文献:
[1] Luo J.-J., Xia J.-J., Pan B.-X., 等. AI for atmosphere–ocean sciences: advancements, challenges and ways forward. National Science Review, 2026.
[2] Li Z., Kovachki N., Azizzadenesheli K., 等. Fourier Neural Operator for Parametric Partial Differential Equations. arXiv 2020.
[3] Vaswani A., Shazeer N., Parmar N., 等. Attention is All You Need. NeurIPS, 2017.
[4] Raissi M., Perdikaris P., Karniadakis G. Physics-informed neural networks: a deep learning framework for solving forward and inverse problems involving nonlinear PDEs. Journal of Computational Physics, 2019.
[5] Pathak J., Wolter K., Chan E., 等. FourCastNet: A Global Data-driven High-resolution Weather Forecasting Model using Adaptive Fourier Neural Operators. arXiv 2022.
[6] Bi K., Xie L., Zhang H., 等. Pangu-Weather: A 3D High-Resolution Model for Fast and Accurate Global Weather Forecast. Nature (预印本) 2023.
[7] Lam R., Weyn J. A., Dueben P., 等. GraphCast: AI model for faster and more accurate medium-range weather forecasting. Science, 2023.
[8] Xu G., Shi Y., Zhu X., 等. Prediction of three-dimensional ocean temperature, salinity and current fields based on Fourier neural operators. Ocean Modelling, 2026.
[9] Chattopadhyay A., Czaja A., Olson D., 等. OceanNet: a principled neural operator-based digital twin for regional oceans. Scientific Reports, 2024.
[10] Bi Z., Shen N., Liu Z., 等. OceanGPT: A Large Language Model for Ocean Science Tasks. arXiv 2023.
[11] Chen B., Gajbhar J., Dusek G., 等. OceanAI: A Conversational Platform for Oceanographic Data. arXiv 2025.
[12] Hazarika S., Lupin-Jimenez L., Couch S., 等. SWR-Viz: AI-assisted interactive visual analytics framework for ship weather routing. arXiv 2024.
[13] Bora A., Chalfant J., Chryssostomidis C. Pier: Physics-Informed Offline Reinforcement Learning for Maritime Routing. arXiv 2026.
[14] Garcia P., Hall J., Martin C., 等. ORCAst: Operational High-Resolution Current Forecasts. arXiv 2025.
[15] Zhang B., Wang F., Fan Y., 等. Deep-learning-based information mining from ocean remote-sensing imagery. Science China Earth Sciences, 2020.
[16] Chen S., Long G., Jiang J., 等. Foundation Models for Weather and Climate Data Understanding: A Comprehensive Survey. arXiv 2023.
[17] Bodnar C., Bruinsma W., Lucic A., 等. A foundation model for the Earth system. Nature, 2025.
[18] Bommasani R., Hudson D. A., Adeli E., 等. On the Opportunities and Risks of Foundation Models. arXiv 2021.
[19] Brown T. B., Mann B., Ryder N., 等. Language Models are Few-Shot Learners. NeurIPS, 2020.
[20] Ramesh A., Dhariwal P., Nichol A., 等. Hierarchical Text-Conditional Image Generation with CLIP Guidance (DALL·E). arXiv 2021.
[21] Lam R., Weyn J. A., Dueben P., 等. GraphCast: AI model for faster and more accurate global weather forecasting. Science, 2023.
[22] Devlin J., Chang M.-W., Lee K., 等. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. NAACL, 2019.
[23] Radford A., Kim J. W., Hallacy C., 等. Learning Transferable Visual Models From Natural Language Supervision (CLIP). arXiv 2021.
[24] Rombach R., Blattmann A., Lorenz D., 等. High-Resolution Image Synthesis with Latent Diffusion Models. CVPR, 2022.
