长三角G60激光联盟导读
近日,北京工业大学陈树君教授团队最新研究成果《A physics-informed and data-driven framework for robotic welding in manufacturing》在国际高水平期刊《Nature Communications》上发表。这是北京工业大学机械与能源工程学院以第一完成单位在《Nature》子刊上发表的首篇论文,标志着学校在机械工程领域取得的重要科学进展。北京工业大学为论文第一完成单位,机械与能源工程学院蒋凡教授为本文唯一通讯作者,博士后刘靖博为唯一第一作者,陈树君教授、大阪大学接合科学研究所田代真一教授和田中学教授为共同作者。

点击图片查看原文
在工业领域,人工智能技术驱动的工业数据模型正在加速制造流程的数字化转型和智能制造的应用。然而,数据质量、模型精度和适用范围之间复杂的相互关系,在实际应用中限制了这些模型在复杂制造场景中的有效性。为了解决这一问题,陈树君教授团队提出了一种专门用于焊接制造领域的框架——PHOENIX(Physics-informed Hybrid Optimization Framework for Efficient Neural Intelligence),通过将物理信息融入输入设计、模型构建和动态优化过程,实现了物理规律与数据建模的深度融合。该框架框赋予了焊接机器人超前感知与智能决策的能力,突破了物理信息与数据模型之间的桎梏,为智能焊接制造提供了全新的优化路径,开辟了焊接过程精确控制与实时调节的全新视角,推动了焊接制造向更高精度和更高效率的发展。

PHOENIX框架与其在机器人空间曲线等离子弧焊接应用流程图
引言
工业人工智能(AI)驱动的数据模型的发展对于实现制造场景的全流程自动化至关重要。它也是推动工业应用中数字化转型与通用人工智能深度融合的关键驱动力 。然而,构建此类模型的过程受到数据质量、模型准确性和泛化能力等多方面复杂关系的制约。数据质量作为模型性能的基础,与准确性和泛化能力之间存在着类似天平的关联:数据质量是根基,而准确性和泛化能力则处于天平两端。随着数据量的增加,模型的结构稳定性可能会有所提升,但要同时提高其准确性和泛化能力,则需要呈指数级增长的数据资源。在人工智能应用于制造业的整个过程中,如何有效平衡这三个因素始终是一项长期且艰巨的挑战。在实际工业场景中,模型不仅要解决数据质量与性能之间的权衡问题,还需满足低缺陷检测率、高稳健性和强扩展性等多维度要求。这些挑战在基于机器人焊接的制造场景中尤为突出,在复杂的焊接路径和操作条件下,自动化焊接方法面临着巨大障碍。在加工路线复杂、不稳定数据稀缺且模型误判成本高昂的场景中,要在复杂零部件制造中实现大规模、可靠的机器人焊接应用并非易事。例如,在商业航空航天领域,发射需求的快速增长要求精确制造航天器燃料箱和空间站密封外壳等结构。这些制造过程必须兼顾小批量生产的复杂性与动态加工场景的复杂性。这对焊接方法的精度和响应速度提出了严格要求。然而,在动态变化的条件下,当前技术存在显著局限性,无法满足先进制造任务的高可靠性要求。
为应对这些挑战,研究人员广泛运用数值模拟来分析焊接过程中产生的热场、质量场和力场分布,以期找出不稳定因素。与此同时,人们也在积极探索数据驱动模型在焊接应用中进行实时预测的潜力。数值模拟结合先前的焊接参数知识,为理解焊接稳定性提供了有力支持。然而,其高昂的计算成本以及在跨越不同时空尺度方面的局限性,严重阻碍了它们在工业场景中的广泛应用。相比之下,人工智能的兴起逐渐降低了实验成本,并对数值计算起到了补充作用。深度学习已越来越多地应用于预测焊接稳定性、检测焊接缺陷和优化焊接参数。
深度学习在焊接制造中的应用遵循一个结构化的四阶段工作流程:工艺数据采集、数据驱动建模、推理模型部署和动态模型优化。工艺数据采集(图 1b)集成电压和电流传感器以捕获一维信号,而基于机器视觉的成像和红外传感器则提供多模态数据,用于分析动态熔池行为。数据驱动建模(图 1c)涉及开发和训练专门用于焊接不稳定检测和缺陷监测的模型。推理模型部署(图 1e)可通过在特定任务环境中进行端到端集成,或通过分布式架构来执行,以增强可扩展性。动态模型优化(图 1d)通过更新数据库和调整模型权重来优化已部署的模型,确保其适应不同的焊接条件。然而,这种工作流程严重依赖高质量数据,并且在现实场景中对复杂热流体耦合的建模能力不足,限制了其泛化能力和稳定性。为克服这些限制,将物理模型的优势与数据驱动方法相结合已成为一条有效途径。融入物理规律的数据驱动模型将物理定律纳入机器学习过程,从而显著降低了对高质量数据的需求,同时提高了模型的泛化能力。在高度可变的条件下,这种方法能够以最少的数据对复杂场景进行高效建模,优化模型性能,并为应对动态工业挑战提供可扩展的解决方案。

Fig. 1: The PHOENIX framework.

ig. 2: Application of the PHOENIX framework in robotic VPPA welding.
机器人变极性等离子弧(VPPA)焊接技术已成为一种高度可靠的铝合金焊接方法,并展现出显著优势,特别是在有效控制焊接缺陷方面。通过在短时间内进行高频极性切换,VPPA 不仅能高效去除材料表面的氧化膜,还能利用焊接电弧的强烈搅拌作用大幅减少气孔和夹杂物。这确保了焊接质量,同时实现了最小变形和残余应力。尽管 VPPA 技术已应用于高精度焊接任务,但由于该过程复杂的多物理场耦合效应和高度动态特性,在复杂操作条件下仍面临相当大的挑战。这些挑战在涉及空间位置连续变化的机器人焊接任务场景中尤为明显。在工业应用中,焊接过程的不稳定性往往导致焊接中断,需要人工现场修复,并重新校准所使用的机器人路径和工艺参数。这些问题显著延长了生产周期并增加了制造成本。因此,实现先进的预测能力以确保焊接过程的稳定性,并为在线调节提供足够的响应时间,是有效应对这些挑战的关键。
基于这些认识,本文提出了一种创新的机器人焊接制造人工智能框架,即焊接高效神经智能物理信息混合优化框架(PHOENIX),如图 1 所示。通过将物理知识嵌入多源数据输入、模型架构设计和优化过程中,PHOENIX 降低了对大量高成本数据集的依赖,同时提高了在复杂工业场景中的预测准确性和稳健性。PHOENIX 框架通过分层结构嵌入物理信息,涵盖工程专业知识、焊接知识、守恒定律和物理模型(图 1a)。这使得物理约束能够无缝集成到数据驱动模型的输入(图 1b)、训练(图 1c)、推理(图 1e)和优化(图 1d)阶段。通过将物理信息与数据驱动方法深度结合,该框架有效解决了传统模型在工业智能应用中遇到的关键瓶颈。以机器人 VPPA 焊接作为典型应用,PHOENIX 框架展现出可靠的预测性能和适应性。通过利用物理信息的深度集成,即使在小批量数据上进行训练,该框架也能提前 0.05 秒实现精确的不稳定预警,预测准确率达 98.1%。PHOENIX 框架突破了传统的数据质量、预测准确性和模型泛化能力之间的权衡,为一系列焊接和增材制造技术提供了通用解决方案(图 1f)。其在商业航空航天场景中的应用显著缓解了高实验成本与快速制造需求之间的矛盾,为实现快速响应和智能制造能力提供了技术路径。
结果
用于机器人 VPPA 焊接的 PHOENIX 框架
为应对这些挑战,我们在 PHOENIX 框架中将物理信息集成到 VPPA 焊接过程的原位监测任务中,在操作条件复杂且数据有限的场景下实现了高精度和高泛化性的熔池稳定性预测能力(图 2)。PHOENIX 框架由四个关键模块组成:用于捕捉熔池动态和形态特征的机器视觉模块、带有物理信息输入的超前预测模块、数据驱动的物理鞍点建模模块,以及通过整合先验数据和新获取数据来动态调整模型参数的增量学习模块。

Fig. 3: Robotic VPPA welding system with diverse welding conditions.
采用具有迁移学习能力的机器视觉模块(图 2e),可有效从原位 X 射线数据中提取关键信息,并从工业相机数据中获取有效信息。原位 X 射线系统用于捕捉熔池的动态特征(图 2a),而工业相机则用于捕捉小孔的形态特征(图 2c)。通过在语义分割网络中应用迁移学习,该模块克服了小训练数据集带来的性能限制,能够在数据有限的条件下,从不同输入源中有效且准确地提取特征。这一设计为 PHOENIX 框架提供了可靠的物理信息,显著提高了系统的预测准确性和整体性能。
基于 PHOENIX 框架,构建了在线超前预测模块,以实现机器人 VPPA 焊接过程中的早期不稳定检测(图 2f)。该模型将机器视觉模块传输的富含物理信息的熔池动态和形态特征作为输入。通过在特征层面进行多信息融合,并应用滑动窗口积累焊接过程的时间序列数据,该模块能够高精度地预测焊接过程短期内的状态。这一预测模块的在线部署有效解决了传统监测系统中固有的延迟问题,使得在不稳定趋势出现之前就能预先实施控制策略。
通过粒子追踪方法捕捉熔池的动态行为(图 2b),并结合准静态焊接参数构建数据驱动的熔池动力学模型(图 2d)。将低成本数据与通过数据驱动的双鞍点物理模块获得的关键数据相结合,训练后的序列预测模块可直接用于预测熔池行为。这种方法显著减少了对昂贵数据的依赖,同时确保了对熔池稳定性和流动行为的可靠预测,从而提高了模型的数据利用效率。
在 PHOENIX 框架内提出了一种将增量学习与历史知识和新数据相结合的分组训练方法(图 2h)。该方法使模型能够在复杂场景中优化和更新其模块参数。通过在双边缘和云平台上进行分布式部署,模型利用样本重放策略和微调机制提升超前预测模块的性能,从而增强其泛化能力。这一设计支持在复杂焊接场景中对预测模块进行动态调整(图 2g),同时使生产方能够精确控制其专有模型和产品规格。此外,基于云的增量学习的集成显著降低了框架的本地部署成本,为中小批量复杂零部件的智能制造提供了高效且经济的解决方案。
机器人 VPPA 焊接数据集构建
在 VPPA 焊接制造过程中,电弧剪切力与重力作用之间的动态平衡确保了熔融金属的定向流动,从而维持焊接过程的稳定性。然而,在大规模铝合金结构的机器人 VPPA 焊接中,多种位置因素会导致熔池相对重力方向发生变化,进而引发流动振荡。当这些振荡累积超过稳定阈值时,熔池很可能发生塌陷,从而中断焊接过程。这种不稳定性需要重新规划机器人路径并修复缺陷,显著增加了工业应用的时间和经济成本。此外,实际的大型部件焊接还面临其他挑战,包括机器人运动过程中的加减速引起的不稳定性、不对称结构导致的散热不均,以及应力集中导致的焊接区域间隙形成。鉴于焊接过程的高度动态性和不可预测性,在不稳定发生后再进行被动调整往往不足以减轻其不利影响。因此,预测不稳定的发生,并在达到临界状态前预留足够的响应时间,对于提高焊接稳定性和工艺可靠性至关重要。通过提前预测熔池行为,可以预先采取措施,从而减少工艺不确定性,提高焊接质量,并优化自动化智能焊接系统的整体性能。
为应对机器人 VPPA 焊接任务中的固有挑战并推动 PHOENIX 框架的发展,研究人员利用集成在机器人 VPPA 焊接系统中的工业相机收集低成本数据(图 3c)。这些数据涵盖焊接参数和熔池形态特征,为模型开发过程提供了宝贵支持。与此同时,通过与大阪大学接合焊接研究所合作,利用原位高速 X 射线采集系统获取关键数据,该系统针对有限的固定焊接位置进行数据采集。与制造中使用的工业相机相比,通常用于研究目的的原位高速 X 射线成像系统在部署、操作和维护方面的成本要高得多(见补充图 1)。因此,在本研究中,将从工业相机获取的数据称为低成本数据,而将从原位高速 X 射线系统获取的数据归类为关键数据。同时,为了进行数据标注,焊接工程师对焊缝的最终质量进行评估,结合焊接速度和不稳定位置评估来计算焊缝长度。这些评估结果作为将熔池状态分为三个不同类别的依据:准稳定状态(图 3d)、非稳定状态(图 3e)和不稳定状态(图 3f)。值得注意的是,虽然准稳定和非稳定熔池仍能维持焊缝成形,但不稳定状态会导致焊缝断裂(图 3b)。在 VPPA 焊接过程中,焊接区域通常会出现类似于激光焊接场景中的小孔现象(图 3a)。然而,与激光焊接中常见的盲孔不同,VPPA 焊接中较高的电弧压力会导致形成通孔。为确保高焊接稳定性,整个焊接过程必须在与准稳定状态相对应的流动行为范围内进行。

Fig. 4: Physical feature-enhanced time-ahead prediction module.
为实现这一目标,我们采用具有迁移学习能力的视觉几何组 16(VGG16)+U-Net 模型(图 2e)作为机器视觉模块的输入数据预处理单元 。该模型能够高效地从 X 射线和工业相机的输出中提取相关特征。预训练的 VGG16 模型可快速适配关键数据和低成本数据来源。通过这个机器视觉模块,我们不仅能够捕捉熔池的动态和形态特征,还能对包含物理信息的关键特征进行量化。利用特征工程算法(见 “方法” 部分)从 X 射线图像中提取关键数据特征(图 4bi),包括熔池后壁流动鞍点的深度(Dj)和偏移距离(Lj)(见 “讨论” 部分)、熔池内的金属流动通道面积,以及对应熔池入口和出口附近流动区域的前壁(A1j)和后壁(A2j 和 A3j)的流动通道面积。此外,通过在焊接机器人焊枪附近部署相机,我们收集了低成本数据(图 4bii 和 iii),如电弧熔化金属形成的熔池入口和出口侧面积(A4j 和 A5j)及周长(C1j 和 C2j),以及沿焊接方向和垂直于焊接方向的长轴和短轴长度(a1j、a2j、b1j、b2j)。此外,还自动测量了熔池入口和出口侧的紧凑度和偏心率。这些低成本数据有助于揭示所获信息中的相关性,进一步拓展了机器视觉模块的功能范围。在进行标准化和归一化处理后,所有数据在特征层面进行融合,为超前预测模块提供输入条件。
随后,我们基于滑动窗口方法开发了长短期记忆网络 - 多层感知器(LSTM-MLP)模型(见 “方法” 部分),进一步优化超前预测模块的设计(图 2f)。滑动窗口技术支持对序列行为进行实时预测。LSTM 用于捕捉焊接过程中的时间特征,有效缓解了传统循环神经网络在处理时间序列数据时常遇到的梯度爆炸和梯度消失问题 。而 MLP 则专注于捕捉 LSTM 可能遗漏的空间特征,进一步挖掘输入特征之间的相互关系。通过对各种常见时间序列预测模型的对比分析,我们发现 LSTM-MLP 模型在捕捉机器人 VPPA 焊接的非稳定行为方面具有更高的预测精度。在非稳定状态下,LSTM-MLP 模型达到了 98.1% 的惊人准确率,显著优于门控循环单元(GRU-MLP)(97%)、循环神经网络 - 多层感知器(RNN-MLP)(96.9%)和长短期记忆网络(LSTM)(96.5%)(见补充表 1-5)。此外,LSTM-MLP 模型在识别非稳定状态时的特异度达到了 98.9%(图 5a)。使用滑动窗口 LSTM-MLP 模型构建的超前预测模块在捕捉时间和空间信息方面明显优于传统时间序列预测模型。此外,对机器人 VPPA 焊接状态进行 t 分布随机邻域嵌入(t-SNE)可视化分析(图 5d)显示,LSTM 输出层能够清晰区分准稳定状态和非稳定状态,有效捕捉了时间序列数据中的相关性。此外,MLP 层进一步增强了区分非稳定状态和不稳定状态的能力,扩大了三种状态之间的界限,这凸显了 MLP 在捕捉空间信息方面的优势。

Fig. 5: Performance and visualization of physical feature-enhanced time-ahead prediction module.
超前预测模块集成了多源信息,能够从时间序列图像中提取时间和空间特征,并对焊接稳定性进行预测,即便预测时间跨度较长也能实现(图 4c)。结合关键数据和低成本数据,该模块对未来 0.01 秒、0.05 秒、0.1 秒、0.2 秒、0.5 秒和 1 秒的焊接状态预测准确率分别达到 98.3%、98.1%、97.1%、93.9%、86.9% 和 86.3%。虽然在 1 秒内的预测准确率保持在 87% 以上,但当预测时间超过 0.05 秒时,准确率会显著下降。当调整滑动窗口,分别积累 0.05 秒、0.1 秒和 0.5 秒的数据时,对未来 0.5 秒焊接状态的预测准确率分别为 94%、97.8% 和 96.7%。在平衡滑动窗口的计算成本和预测准确率后,最佳方案是以 0.2 秒的数据来预测 0.05 秒后的焊接状态,这为后续的控制系统设计提供了充足的冗余。此外,我们还比较了使用不同数据源时的预测准确率(图 4c)。在相同条件下,仅使用低成本数据或关键数据时,预测准确率分别为 96.2% 和 87.4%。当使用全部数据源时,对非稳定状态的检测精度可高达 95.4%,而仅使用部分数据时,精度则降至 87.69% 和 67.69%(图 5b)。结果表明,仅基于关键数据进行训练时,模型倾向于预测准稳定状态;而仅基于低成本数据训练时,模型则会偏向于预测不稳定状态。为进一步分析这一现象,我们对超前预测模块进行了消融实验(图 5c),从总共 18 个特征中提取出对焊接状态影响最大的前 6 个特征(见补充图 2)。其中,包含熔池流动行为信息的 5 个关键特征在不同阶段的预测准确率中始终名列前茅,尤其在准稳定状态下,这些特征在模型决策中起到主导作用。因此,超前预测模块应尽可能纳入更多关键特征,以确保对未来焊接状态的准确预测。尽管该模型已具备良好的预测能力,但尚未完全掌握低成本数据和关键数据特征之间的关系。
数据驱动的物理鞍点建模
在焊接过程中,通过融合关键数据和低成本数据,我们成功利用超前预测模块对未来焊接状态进行了预测。尽管这一成果颇具前景,但在实际应用中仍面临一些挑战。例如,由于原位 X 射线成像成本高昂且可能存在健康风险,难以在工程实践中广泛应用。因此,寻找获取熔池流动通道和鞍点信息的替代方法成为一项重要任务。然而,线扫描、激光雷达(LiDAR)和立体视觉等技术在实际应用中面临诸多挑战,尤其是在捕捉流动通道信息方面,焊接过程中的电弧干扰是主要障碍。若忽略这些数据来源,预测准确率和召回率将大幅下降。为解决这一问题,我们深入分析了在焊接热输入影响下熔池金属流动行为的变化,并采用粒子追踪技术(图 6a 及 “方法” 部分)对流动行为和模式进行分析。

Fig. 6: A double saddle point model in VPPA welding via a particle tracer method.
在实际操作场景中,我们首先运用粒子追踪技术和原位 X 射线成像技术来捕捉目标熔池的流动行为信息,这些信息有助于构建数据驱动模型。通过追踪在不同深度释放的示踪粒子的轨迹,可以获取熔池内液态金属的定向流动模式(图 6b)。研究表明,熔池前壁的熔融金属在熔化后会分流,并流向两侧壁,最终在熔池后壁汇聚。熔融金属一旦汇聚,便会朝着熔池的入口和出口两侧流动,并在该处凝固,形成后壁表面。熔融金属在后壁汇合后,会在形态曲率发生变化的鞍点位置分流,且该位置的流速趋近于零(图 6c)。基于这一现象,我们提出了适用于机器人变极性等离子弧(VPPA)焊接过程的双鞍点流动模型(图 6d)。通过多次实验,我们发现离子气流量和电流(EN 和 EP)对鞍点位置和流动通道面积有着显著影响。增大电流会使更多金属熔化,进而增加熔池的宽度和深度,从而扩大流动通道面积。此外,更高的温度会增强熔融金属的传热传质过程,进一步提高其流速。离子气流量的增加会提升等离子弧的熔透能力和挺度,加剧电弧对熔池内熔融金属施加的剪切力,促进熔融金属的流动,并增大熔池出口侧的面积。另外,在受限的小孔内,电弧的剪切力和压力会驱动熔融金属,导致后壁处出现双向逆流,从而产生分流现象。焊接过程中熔融金属传质行为的稳定性是维持焊接过程顺利进行的关键因素。我们还发现,在熔池从稳定状态向不稳定状态转变的过程中会出现非稳定状态现象,由于焊接过程中热力学耦合情况复杂,很难通过物理推导直接得出鞍点的变化规律。为验证这些发现,我们在前期研究中进行了数值模拟。结果表明,电流和离子气流量的增加会导致鞍点位置发生偏移以及流动通道面积发生变化。
此外,我们将准静态焊接特征(如 EN 电流、EP 电流和离子气参数)作为物理约束条件,构建了一个数据驱动的熔池动力学模型,即数据驱动的物理鞍点模型(图 7a 及 “方法” 部分)。这一物理建模过程使得通过低成本数据预测关键特征成为可能。在超前预测模块中,通过将低成本数据与利用数据驱动的物理双鞍点建模获取的关键数据相结合,我们实现了平均准确率达 97.4% 的精准预测(图 4c),优于仅使用低成本数据或关键数据的预测方法。该模型保持了较高的准确性(图 5b)。这种方法的优势在于,一旦模型完成训练,便不再依赖于直接使用关键数据,从而降低了实际应用中的成本和复杂度。此外,对于已构建好的超前预测模块,无需进行额外的架构调整或优化。

Fig. 7: Physics-constrained data-driven saddle point model for quasi-static information injection in welding scenarios.
在传统方法中,焊接参数通常作为独立特征直接输入到数据驱动模型中。然而,这种方法无法有效地指导模型优化过程,也难以提升预测结果。由于焊接参数属于准静态特征,其对模型性能的影响较为有限。电流、离子气和保护气等参数很难直接融入模型。受条件生成对抗网络的启发,我们提出了一种基于条件的神经调节(CBN)- 反向传播神经网络(BPNN)方法。该方法能够有效地将物理信息注入数据驱动模型,增强模型的泛化能力,并降低其对大规模数据集的依赖(图 7b)。CBN 的核心在于它能够根据输入条件自动调整输出调制。通过动态调整神经调节机制,可以增强模型的表达能力和稳定性,同时通过有选择地对离子气、EN 电流和 EP 电流等焊接输入参数应用条件驱动调制,优化模型的训练过程和预测准确性。经过训练,CBN-BPNN 模型可以独立运行,无需依赖关键数据输入,同时仍能准确捕捉熔池动态等关键特征,并且准静态信息也能有效地集成到主网络架构中。具备多输入多输出(MIMO)能力的 CBN-BPNN 模型能够更好地利用低成本特征之间的相关性,从而增强模型的学习能力。这一特性显著降低了工程应用中的并行计算成本,有效提高了计算效率。
为了进一步验证模型的稳健性,我们比较了多输入单输出(MISO)模型(多次预测)和 MIMO 模型(单次预测)的输出误差表现(图 7c)。结果表明,尽管 MISO 模型在某些输出维度上的预测误差略小,但 MIMO 模型总体表现出更稳定可靠的性能。与 MISO 策略相比,MIMO 模型在所有输出中保持较低的预测方差和更紧凑的误差分布。这种统一的训练方法使模型能够有效利用维度间的相关性,提高泛化能力,并降低独立训练模型中常见的过拟合风险。这一特性使得 MIMO 模型在实际工程应用中更具实用性。此外,为了进一步验证该方法是否最优,我们将我们的模型与其他机器学习模型进行了比较。在平均绝对误差(MAE)、均方误差(MSE)、均方根误差(RMSE)和决定系数(R²)等指标上,CBN-BPNN(MIMO)模型的表现优于其他方法(见补充说明)(图 7d)。总之,基于数据驱动的物理鞍点建模的模型,将关键数据与物理约束相结合,能够在实际应用中保持较高的预测准确性和稳定性,而无需依赖关键数据。这种方法成功地用小数据集替代了关键数据,为优化和稳定焊接过程提供了可靠的预测工具。
基于先验数据与新数据融合的动态模型参数调整
到目前为止,我们已经验证了基于 PHOENIX 框架构建的超前预测模块是一种有效预测熔池失稳的工具,从而为机器人焊接应用中的实时控制任务提供了有力支持。然而,深度学习模型的泛化能力和实时性能仍然是其在实际工业部署中的关键限制因素,尤其是在机器人变极性等离子弧(VPPA)焊接领域。工业场景本身具有复杂性和动态性,空间定位变化、夹具对准不精确、热积累导致的热应变间隙、复杂结构部件中的不对称散热以及焊接过程中的送丝异常等因素(图 8b),都会对模型在实际条件下的性能产生不利影响。尽管超前预测模块在某些工业场景中表现良好,但其性能会在条件变化时下降。这种下降主要源于不同环境下熔池流动行为的差异,进而改变了形态特征的时空特性,降低了输入模式的一致性。这凸显了在数据稀缺的情况下提高模型准确性,并在不同操作条件下扩展其泛化能力的迫切需求。

Fig. 8: Dynamic model parameter tuning via incremental learning with an integrated prior and new data.
为应对这些挑战,我们提出了一种基于 PHOENIX 框架的动态模型参数调整方法。该方法通过增量学习将先验知识与新获取的经验相结合,使模型能够在不同操作条件下自主优化参数,确保时间序列预测模块在复杂场景中保持高效率和高精度(图 8a)。通过冻结模型的某些层,它既能保留对先前场景的预测能力,又能大幅降低计算开销,提高训练效率。同时,通过重新平衡新场景和先前场景的数据比例,对模型进行增量再训练,使其在适应新场景的同时,保持对以往场景的预测准确性,从而增强整体适应性和泛化能力。利用分布式双边缘计算系统与云技术相结合,通过增量学习对预测模块进行微调,以提高其适应性。具体而言,部署两个边缘计算设备用于工业应用。第一个设备用于在机器人 VPPA 焊接场景中进行超前预测,生成熔池标签;第二个设备则用于在线监测焊缝状态,并建立相应的熔池标签。这些设备生成的小数据集被传输到基于云的服务器,以进行小批量快速增量学习,从而实现对超前预测模块的更新。更新后的模型权重随后被传回边缘设备进行自适应调整。这种设计使超前预测模块能够在广泛的焊接场景中进行自适应参数调整,更好地适应当前工作条件。该方法特别适用于中小批量复杂大型部件的制造。除了增强模型适应性外,它还能让制造商保持对专有模型和特定产品配置的控制权,从而降低模型泄露和数据污染的风险。此外,基于云的集中式训练和优化策略显著降低了多设备本地部署的成本,提高了系统的经济可行性和可扩展性。
我们分别使用陀螺仪和预先部署的机器视觉模块来辅助场景感知和焊缝状态监测,以支持数据校正。焊缝检测模块可区分不同焊接条件下的焊缝和熔池状态,并将结果与时间序列预测模块的结果进行比较(图 9b)。焊缝检测的准确率接近 100%,因为焊缝是熔池最终凝固的结果,可以根据观测结果进行标注。相比之下,超前预测模块的预测准确率较低,这是由于熔池本身具有动态变化的特性。通过利用熔池和焊缝之间的时间和因果关系,该模块能够对熔池状态进行标注(图 8a)。从焊缝检测模块获得的结果和预测的焊接状态被传输到云端。由于数据被简化为一维格式,传输量极小,因此延迟可以忽略不计。在云端,通过同步时间戳对熔池预测中遗漏和错误的标签进行校正。此外,还采用了数据修剪技术对数据集进行对齐和量化,防止因数据量过大导致的污染,从而有效保持模型的性能。这种设计提高了数据处理效率和模型的稳健性,使其能够更准确地处理复杂场景中的数据异常和错误。自动化校正机制可在操作过程中及时纠正焊接错误,从而提高工业应用中焊接任务的质量和稳定性。

Fig. 9: Performance visualization of dynamic model tuning via incremental learning.
在云端,我们部署了一个增量学习模块,通过微调的方式,利用校正后的数据自适应地调整模型超参数。这种小批量微调过程采用低学习率,以尽量减少对初始时间序列预测模型的改动,同时确保新知识得以融入,且不会覆盖先前学习到的经验。具体而言,通过冻结超前预测模块的某些层来控制学习过程,以适应新的数据分布。通过评估不同的层冻结配置效果(图 9a),我们发现冻结单层可显著增强模型对新场景的适应性,尽管这会降低模型对原始场景的敏感度。相反,增加冻结层的数量可恢复模型对原始场景的感知能力,但会削弱其对新条件的适应性。冻结两层实现了最佳平衡,使模型既能保留先验知识,又能有效从新数据中学习。此外,样本重放策略通过将新样本与部分旧数据相结合,组成小训练批次,提升了模型的适应性。这种方法可防止模型因过度拟合新数据而遗忘对先前场景的理解。实验结果表明,新旧数据比例为 1:2 时达到最佳平衡,确保了模型的稳定性和适应性。利用这一增量学习策略,超前感知模块在类似复杂场景中的准确率可保持在约 96%(图 9b)。
讨论
在实际制造场景中,主动检测异常状态仍然是智能制造面临的一项关键挑战,尤其是在处理小规模数据集时。在这些限制条件下,实现高准确率、广泛的泛化能力和低漏检率极其困难。为解决这些问题,PHOENIX 框架提供了一种创新解决方案,将物理信息与数据驱动模型相结合,有效实现了以下关键目标:(1)在主动异常状态检测任务中确保高准确率和低漏检率;(2)通过在数据稀缺场景中构建可靠的物理模型,降低方法对关键数据的依赖;(3)通过自主优化,增强模型在复杂制造场景中的自适应能力。凭借这些优势,PHOENIX 框架为智能制造系统提供了新视角,并为克服传统模型在工业生产中面临的挑战提供了切实可行的途径。
通过将 PHOENIX 框架应用于机器人 VPPA 焊接过程,验证了将物理信息融入模型开发和部署流程的有效性和实用性。融入物理信息的超前预测模块在预测熔池失稳方面达到了 98.1% 的准确率。即使预测一秒后的焊接状态,该模型的预测准确率仍达到 86%,展现出其主动感知能力。此外,基于物理信息的数据驱动模型通过构建 VPPA 物理鞍点模型,有效降低了对关键数据的依赖。通过用代理物理模型的输入替代昂贵数据,超前预测模块保持了 97.4% 的准确率,凸显了在不影响性能的前提下最大限度减少数据依赖的潜力。最后,包括样本重放和数据修剪等策略的增量学习,实现了模型参数的自主优化。在六种突发复杂环境场景下,该模型的准确率约为 96%,显著提升了其泛化能力。通过基于双边缘和云架构的分层部署方案,PHOENIX 框架有效解决了制造企业快速主动优化小规模复杂产品的难题。这表明该框架有潜力成为推动智能制造系统发展的有效工具。
在本研究中,我们结合熔池内熔融金属流动行为的实时 X 射线成像数据与主动预测模型的消融测试结果,进一步分析了熔池失稳的机制。VPPA 焊接熔池内熔融金属定向流动和鞍点行为的动态稳定性对维持焊接过程稳定性至关重要。特别是,熔融金属在实壁鞍点位置的汇聚和分流有助于形成稳定的焊缝。焊接位置的变化会破坏熔池内熔融金属流动的平衡,进而影响鞍点位置的稳定性,最终影响焊缝质量。在间隙焊接过程中,前壁没有足够的熔融金属补充后壁的汇聚,导致难以维持鞍点的动态平衡。这一现象凸显了在机器人 VPPA 焊接任务中维持鞍点动态平衡的重要性。通过将熔池的动态特征(包括鞍点行为)作为约束条件纳入全过程模型的构建和优化流程,可增强熔池的稳定性,并显著提升模型的整体性能。这反过来又进一步加强了焊接过程的精确控制和质量预测能力。
然而,仍有一些挑战值得进一步探索。首先,物理信息在制造过程中的有效应用依赖于先验知识和对过程本身的理解,这与 AI 模型的完全黑箱特性形成对比。在数据稀缺场景中,我们希望通过融入物理信息提升模型性能;因此,如何在物理信息与所构建模型的黑箱特性之间找到正确的平衡点,仍是一项关键挑战。其次,虽然已实施数据重放和修剪策略来减轻新场景中的过拟合问题,但超前预测模型在实际应用中的逐步部署和迭代学习,需要进一步研究如何有效减少历史数据对当前模型的影响,确保在不影响泛化能力的前提下实现自适应学习。与此同时,还需要进一步研究如何增强对各种生产规模的适应性,同时降低部署成本,以提高整体制造效率。
本研究实现了物理信息与数据驱动模型在机器人焊接场景中的融合,为智能焊接技术的实现奠定了坚实基础。所提出的 PHOENIX 框架展现出高度的泛化能力,在包括基于电弧的增材制造和其他先进制造领域等更广泛的应用中具有巨大潜力。此外,根据具体的检测和监测目标,该框架还适用于快速预测机械性能和微观结构,以及在线检测气孔和裂纹等缺陷。通过用物理信息约束输入信息,模型可有效缓解数据数量和质量问题,显著提高模型的准确性,降低漏检率,并增强其在不同场景下的适应性和泛化能力。
该项研究得到了国家自然科学基金(优秀青年科学基金项目、面上项目、联合基金重点支持项目)、济南创新团队、泉城学者、国家留学基金委与JWRI International Joint Research Collaborator项目的支持和资助。

第一作者
刘靖博
北京工业大学
机械与能源工程学院博士后
北京工业大学机械与能源工程学院博士后,合作导师为陈树君教授,研究方向为等离子弧焊接/增材制造机理与过程监测,主持北京市自然科学基金青年项目。以第一/通讯作者发表SCI论文9,包括Nature Communications、Journal of Manufacturing Processes、Physics of Fluids等高水平学术期刊,以学生第一发明人获国家发明专利授权2项,获博士研究生国家奖学金、北京市优秀毕业生等奖励。

通讯作者
蒋凡
北京工业大学
机械与能源工程学院教授
主要从事等离子弧焊接制造机理、焊接制造建模与数字孪生、焊接制造过程智能控制等研究。先后主持国家自然科学基金优秀青年基金、国家重点研发计划课题等,已发SCI收录论文50余篇,获授权发明专利25项(美国专利1项)。牵头获得机械工业科学技术奖技术发明二等奖、中国产学研合作创新与促进奖产学研合作创新成果奖一等奖,参与获得国家科技进步二等奖、北京市科学技术奖科技进步一等奖2项等。
Liu, J., Jiang, F., Tashiro, S. et al. A physics-informed and data-driven framework for robotic welding in manufacturing. Nat Commun 16, 4807 (2025).
https://doi.org/10.1038/s41467-025-60164-y以及北京工业大学网站
长三角G60激光联盟陈长军转载
热忱欢迎参加我们在2025年5-27-29日举办的两机展和激光在两机(飞机发动机和燃气轮机)及低空经济中的应用大会