摘要:在工业 4.0、智慧城市等领域,数字孪生技术正在被广泛应用,其通过构建与物理实体一一对应的虚拟模型,能够实现对设备、产品和系统的实时监控、预测性维护及优化管理。然而,为数字孪生高效地生成准确地网络流量数据包仍然是一项极具挑战的任务。该任务具有时序依赖性,且在复杂网络行为和多样化场景的影响下,流量生成过程存在高度的不确定性和复杂性。为了解决这一问题,本文提出了一种基于扩散模型的大批量网络流量数据包生成算法——FlowDiff 和一种时序扩散生成模型TDGM。FlowDiff 算法将流量数据包的生成作为反向扩散过程,根据流量的时序特性和外部场景条件,通过逐步去噪生成符合实际网络流量特征的数据包。TDGM 模型是为了适应网络流量中的时序依赖和周期性变化特性设计的模型。该模型引入时序感知特征嵌入层,将流量的时序信息与重要特征进行融合,从而增强了流量特征之间的时空关联。模型还结合卷积神经网络和 Transformer 模块,提取流量的局部特征和全局特征,进行有效融合。最后,将历史流量数据和周期性特征作为扩散模型的条件输入,利用交叉注意力机制进一步优化生成过程。实验结果表明,FlowDiff 在真实网络流量数据集上的表现优异,在与真实数据流量的比较中,充分验证了生成的准确性和有效性,展示了其在数字孪生系统中应用的有效性和优势。