2024(4):775-775. DOI: 10.16337/j.1004-9037.2024.04.001
摘要:
2024(4):776-793. DOI: 10.16337/j.1004-9037.2024.04.002
摘要:弥散磁共振成像(Diffusion magnetic resonance imaging,dMRI)是一种通过测量水分子在不同方向上的弥散情况来获取微观结构信息的先进医学影像技术,在临床辅助诊疗中的应用日益广泛。在中医诊疗领域,dMRI技术同样展现了其独特的潜力和价值,为中医“辨证施治”提供了更为客观的依据。在中医诊疗中,dMRI不仅能够帮助医生更准确地诊断疾病,还能监测疾病的发展过程以及治疗效果,为中医“治未病”和“个体化治疗”提供了有力的支持。然而,dMRI技术在中医诊疗领域的应用也面临着诸多挑战。本文集中回顾了近几年dMRI技术在中医诊疗中的应用,并探讨了高级dMRI技术在中医诊疗领域的广阔前景和潜力,同时也讨论了当前dMRI应用的局限性以及dMRI在中医诊疗应用中的挑战。本研究将促进医工交叉,尤其是中医-智能影像技术领域的交流与合作,并推动dMRI技术在中医诊疗中的深入应用和发展。
2024(4):794-812. DOI: 10.16337/j.1004-9037.2024.04.003
摘要:新辅助化疗已成为乳腺癌标准治疗策略,而磁共振成像是评估乳腺癌对新辅助化疗反应的首选影像学方法。虽然磁共振成像能提供关于肿瘤位置、大小及微环境等详细信息,但肿瘤的多样性变化给乳腺癌新辅助化疗的精准评估带来挑战。基于机器学习和深度学习的人工智能方法展现出识别磁共振成像数据中复杂模式的能力。通过临床影像特征分析、影像组学分析和生境分析等方法,人工智能技术已显著提升乳腺癌新辅助化疗评估的性能和效率,有助于实现个性化治疗策略。本文介绍了乳腺癌新辅助化疗评估所用的磁共振成像数据及性能指标,总结了人工智能技术在此领域的应用进展,同时探讨了当前人工智能技术在实际应用中的挑战和未来可能的研究方向。
2024(4):813-826. DOI: 10.16337/j.1004-9037.2024.04.004
摘要:脑功能连接(Functional connectivity, FC)网络作为潜在的脑影像标志物对孤独症谱系障碍(Autism spectrum disorder, ASD)的辅助诊疗研究具有重要作用。然而现有的FC生成方法大多仅基于脑影像数据,未充分考虑个体的临床指标从而易丢失疾病的特异性信息。而且,ASD作为一种谱系障碍,其临床指标存在显著的个体化差异。因此,仅基于脑影像数据的传统生成模型在生成准确的且能反映个体化临床指标的ASD个体FC的任务上存在挑战。针对上述挑战,提出了个体化临床指标引导的沃瑟斯坦生成对抗网络模型(Clinical-indicator-aware Wasserstein generative adversarial network, CI-WGAN),用于生成孤独症个体化FC网络。该模型引入个体化临床指标引导机制,实现了高精度ASD患者FC网络的生成。基于全世界最大孤独症脑影像公开数据集之一的ABIDE I数据集进行实验,CI-WGAN生成FC与真实FC的峰值信噪比(Peak signal-to-noise ratio, PSNR)、结构相似度(Structural similarity, SSIM)与平均绝对误差(Mean absolute error,MAE)分别达到19.037、0.236与0.178,相较于其他FC生成模型分别提升了3%、12%与2%。此外基于生成FC和独立临床验证指标的表征相似度分析(Representational similarity analysis, RSA),CI-WGAN生成的FC相较其他模型生成FC最少提高了0.1倍和3.7倍,证明了CI-WGAN生成的FC包含更多的ASD个体特异性信息。本文提出的CI-WGAN模型实现了高质量个体化FC的生成,为ASD的早期诊断和个性化治疗提供了有力的技术支持。
2024(4):827-842. DOI: 10.16337/j.1004-9037.2024.04.005
摘要:近年来,功能性脑网络已被用于自闭症谱系障碍(Autism spectrum disorder, ASD)等脑部疾病的诊断。现有研究表明,将静息态功能磁共振成像(Resting-state functional magnetic resonance imaging, rs-fMRI)数据以及非影像信息结合起来构成人口图,然后采用图神经网络(Graph neural network, GNN)进行学习和分类的方法对ASD的诊断十分有效。然而,大多数研究仍然面临两个挑战:一是仅使用皮尔森相关系数等方法构建功能连接矩阵无法有效地识别和分析与疾病相关的局部脑区和生物标志物;二是无法在GNN上有效地学习人口图中节点特征的多尺度信息。为解决这些问题,提出了一种基于注意力机制的多尺度残差融合图卷积网络(Multi-scale residual fusion graph convolutional networks, MSRF-GCN)。该算法通过设计一个功能连接生成器来提取具有远程依赖关系的时间相关特征,从而有效地定位和识别对诊断有益的脑区。同时,通过设计多尺度残差融合算法,学习人口图中的多尺度信息。此外,还引入了Edge Sparse策略,通过随机丢弃初始人口图中的边,以增加节点连接的稀疏性,进而减少训练期间过拟合的风险。通过在自闭症脑影像数据交换项目(Autism brain imaging data exchange, ABIDE)上进行实验的结果证明了MSRF-GCN在ASD诊断方面的有效性。
2024(4):843-862. DOI: 10.16337/j.1004-9037.2024.04.006
摘要:融合大脑结构和功能网络的多模态脑网络能够挖掘不同模态间的互补信息,有效提高癫痫等神经系统疾病的诊断准确率,在神经疾病诊断上具有优势。然而,由于多模态数据采集时间长、成本高,在实际应用中常面临模态缺失问题,导致可用数据量减少,模型的诊断精度和泛化能力下降。针对某一模态数据完全缺失问题,提出了基于图学习与循环一致生成对抗网络(Cycle-consistent generative adversarial networks, CycleGAN)的图CycleGAN方法。该方法通过引入图卷积神经网络与图注意力机制等图学习方法捕捉脑网络不同脑区间的特征信息,强化生成框架对图形式脑网络的特征提取能力,实现脑结构网络与功能网络的相互生成。此外,针对目前较少利用诊断结果评估生成数据质量的情况,提出了一种融合真实脑网络与生成脑网络的多模态融合分类模型,以进一步评估生成脑网络的有效性。在癫痫数据集上的实验结果表明,图CycleGAN方法能够有效利用已有的模态信息,实现缺失脑网络的生成。
2024(4):863-873. DOI: 10.16337/j.1004-9037.2024.04.007
摘要:白质纤维束分割方法通过识别连接不同脑区的白质通路,为脑连接分析提供了重要的神经通路参考信息。然而,传统的白质纤维束分割方法主要依赖于弥散磁共振图像(Diffusion magnetic resonance imaging , dMRI),由于获取弥散磁共振图像比较耗时,这极大地限制了其在临床中的应用。为解决此问题,提出了一种基于T1加权图像的白质纤维束分割方法,通过计算T1加权图像的结构张量来提示可能的纤维走向,进而提高白质纤维束的分割精度。此外,本文在模型训练期间引入弥散磁共振图像的特权信息来指导模型学习,从而提升白质束分割模型性能,具有挑战性的束分割效果提升明显,其中左穹窿(Left fornix, FX_left)的Dice得分提高了5%,右穹窿(Right fornix, FX_right)的Dice得分提高了6
2024(4):874-885. DOI: 10.16337/j.1004-9037.2024.04.008
摘要:近年来,肝癌已经成为严重威胁人类健康的疾病,多模态超声成像是其诊断的重要手段之一。与临床医生结合多模态超声诊断肝癌类似,利用多模态融合的方法集成各模态超声的影像特征有望提高肝癌诊断的准确性。然而,现有的多模态融合方法在融合过程中往往将各模态的特征信息孤立处理,未能充分考虑模态内的样本相似性和模态间的语义一致性,同时忽视了模态的不确定性。因此,提出了一种基于多模态超声对比学习的肝癌诊断方法,旨在充分利用各超声模态的特征信息,提高诊断准确率。该方法利用监督对比学习深入挖掘模态特征,捕获模态内同类样本之间的相似性信息和不同模态之间样本的语义一致性信息。此外,该方法基于主观逻辑引入了模态不确定度的度量,实现了模态信息的动态融合,具有较好的鲁棒性。多模态超声影像评估结果显示,本文提出的方法实现了85.21%诊断准确率,相较于主流的多模态融合方法性能得到了提升。
2024(4):886-897. DOI: 10.16337/j.1004-9037.2024.04.009
摘要:天线方向图测量是天线测量的重要内容。针对天线方向图室外测量困难的问题,提出了一种基于生成对抗网络的天线三维方向图室外测量方案。该方案利用无人机对天线方向图数据进行采集,对采集的数据进行修正,获得待测天线和接收天线极化匹配时的直射径数据,最后利用训练好的生成对抗网络重构出天线的三维方向图。仿真结果表明,本方案可以高效、高精度地完成天线三维方向图的测量,具有一定的实用价值。
2024(4):898-907. DOI: 10.16337/j.1004-9037.2024.04.001
摘要:针对捷变频信号的相参积累处理进行研究,提出了一种基于频率分组编码信号的相参积累算法。以线性调频(Linear frequency modulation,LFM)信号为基础,构建了频率分组编码信号,使得发射信号的脉冲载频序列具有一定随机性,保证了波形的抗干扰能力。同时针对频率捷变信号相位非相参带来的主瓣展宽和旁瓣抬高问题,设计了对应编码信号的相参处理方法。首先对回波脉压后的信号进行高分辨距离补偿,然后通过速度遍历插值和距离一致性校正实现脉组内相参处理,最后利用编码信号载频序列的优势实现脉组间相参处理。在仿真实验中,对构建的编码信号相较于LFM信号在抗干扰方面的优越性进行了验证,同时验证了所提相参处理方法相较于基于压缩感知的稀疏重构算法的有效性。
2024(4):908-921. DOI: 10.16337/j.1004-9037.2024.04.011
摘要:针对无人机航拍图像背景复杂、小尺寸目标分布密集等造成的检测精度低等问题,提出一种高分辨率特征增强的无人机航拍小目标检测算法。首先,提出了高分辨率特征增强网络,通过减少主干网络的下采样倍数来扩大输出特征图的尺度,同时引入双线性插值法来减少采样后特征信息的丢失,从而保留更多语义特征与细节特征。其次,在主干网络嵌入一种结合局部跨阶段结构的快速空间金字塔池化(Spatial pyramid pooling fast cross stage partial construction,SPPFCSPC)模块,增强局部与全局特征的信息融合,从而获得更大的感受野。最后,通过马赛克混合数据增强方法来增强图像背景的复杂度,提高模型的泛化能力。在公开数据集VisDrone 2019上的实验结果表明,与“你只需看一次”(You only look once,YOLO)系列等其他主流算法相比,本文算法的平均精度均值有显著的提高,在不同场景下均验证了本文算法的优越性,表明本文算法对无人机航拍图像的密集小目标检测任务有较强的实用性。
2024(4):922-932. DOI: 10.16337/j.1004-9037.2024.04.012
摘要:传统的图像描述方法仅使用当前时刻的视觉信息和语义信息来生成预测词,而没有考虑过去时刻的视觉信息和语义信息,从而导致模型输出的信息在时间维度上比较单一,因此生成的描述语句在准确性上有所欠缺。针对此问题,提出一种融合多时间维度视觉与语义信息的图像描述方法,有效地融合了过去时刻的视觉信息和语义信息,并设计一种门控机制动态地对两种信息进行选择利用。在MSCOCO数据集上进行实验验证,结果表明该方法能够更准确地生成描述语句,和当前最主流的图像描述方法进行对比,性能在各项评价指标上都得到了可观的提升。
2024(4):933-943. DOI: 10.16337/j.1004-9037.2024.04.013
摘要:在基于深度学习的图像修复算法中,当存在大面积掩码时,由于缺乏合理的先验信息指导,修复结果往往会出现伪影和模糊纹理等现象。针对此问题,提出将先验特征与图像预测滤波相结合的图像修复算法。该算法包含两个分支:图像滤波核预测分支和特征推理与图像滤波分支。从图像滤波核预测分支的解码器部分提取特征,利用多尺度外部空间特征融合对掩码区域特征进行重建,并传递给另一分支的解码阶段作为先验特征,为图像修复提供更为丰富的语义信息。然后,在特征推理和图像滤波分支部分引入空间特征感知推理块,它能够过滤掉分散注意力的特征,同时捕捉信息丰富的远距离图像上下文进行推理。最后,使用图像预测滤波核进行过滤消除伪影。在CelebA和Places2数据集上与其他修复网络进行对比实验,证明了该方法在修复质量上的优越性。
2024(4):944-953. DOI: 10.16337/j.1004-9037.2024.04.014
摘要:有效获取点云特征是分析和处理三维点云场景的关键。针对目前深度学习方法特征信息提取不充分,难以捕捉深层次语义信息的问题,提出了一种融合细粒度特征编码的网络来提高点云分类与分割任务的准确率。首先,特征提取模块包含2个子模块:一个是扩张图卷积模块,相比图卷积能够提取更丰富的几何信息;另一个是细粒度特征编码模块,能够获取局部区域的细节特征。其次,通过可学习参数将二者动态融合,有效地学习每个点的上下文信息。最后,将提取的所有特征相加,通过通道亲和注意力模块来强调不同通道,协助特征图来避免可能的冗余。在ModelNet40及ScanObjectNN数据集上进行点云分类实验,总体分类精度分别为93.3%和80.0%。在ShapeNet Part数据集上进行点云部件分割实验,平均交并比为85.6%。实验结果表明,与目前主流方法相比,该网络具有较优的性能。
2024(4):954-966. DOI: 10.16337/j.1004-9037.2024.04.015
摘要:在结直肠癌的早期筛查中,通过对结肠镜图像进行自动化的息肉检测和分割可以提高诊断效率和准确性。由于肠道内部环境的复杂性以及图像质量的限制,自动化的息肉分割仍然是一个具有挑战性的问题。针对这一问题,提出了一种基于Transformer和空洞卷积特征融合的息肉分割双解码模型(Dual decoded polyp segmentation model fusing Transformer and dilated convolution, FTDC-Net)。该模型以ResNet50作为编码器,以便能够更好地提取图像深层次特征。使用 Transformer 编码模块,它的自注意力(Self-attention)机制能够捕捉输入之间的长距离依赖关系,模型中使用了不同的空洞卷积(Dilated-convolution)来扩大模型的感受野,让模型能捕捉到结肠镜图像更大范围内的信息。本文网络模型的解码部分使用双解码结构,包含一个自动编码器分支,自动编码器可以重构输入,另一个编码分支用于分割结果。模型中,自动编码器的输出被用于生成一个注意力图作为注意力机制,该图将被用于指导分割结果。在Kvasir-SEG和ETIS-LARIBPOLYPDB标准数据集上进行了实验验证,实验结果表明FTDC-Net能有效地分割出结肠息肉,相比目前主流息肉分割模型,在各项评价指标上均取得了较高的提升。
2024(4):967-983. DOI: 10.16337/j.1004-9037.2024.04.016
摘要:利用静息态功能磁共振成像技术获取脑区的功能连接(Functional connection, FC)被广泛地应用于轻度认知功能障碍(Mild cognitive impairment, MCI)的分类研究中。然而,全脑FC用于分类通常存在信息冗余和特征维度灾难问题,为此,提出一种“G-Lasso +特征压缩”的新方法来解决以上问题。首先,利用盲源分离技术获得全脑功能脑区的活跃信号时间序列,采用G-Lasso构建FC稀疏网络;其次,计算MCI患者、正常被试及所有被试在组平均上的稀疏FC,并结合欧氏距离进行簇Class 1~Class 3中心判决,获取簇间差异特征信息;最后,将每个被试的稀疏FC表达为簇中心的线性组合,获取压缩的FC作为关键特征完成分类。实验采用公开的数据库测试本文方法,结果表明,所提方法进行Class判决后获得簇间特征具有显著差异且提供了有效的标志信息,进一步压缩获取关键特征的分类准确率(89.8%)比仅使用稀疏方法提高了5%~10%。该结果表明,为了解决全脑FC存在的问题,需要考虑到特征选择和降维,但有诸多不确定因素信息,可以适当地将“稀疏+压缩”进行结合。
2024(4):984-995. DOI: 10.16337/j.1004-9037.2024.04.017
摘要:自闭症谱系障碍(Autism spectrum disorder,ASD)是一种最常见且具有遗传性的神经发育障碍疾病,具有社交沟通缺陷等多种症状。准确识别生物标记物对ASD的早期干预起到至关重要的作用。现有大量方法利用了多站点影像数据来增加样本量,从而提高了方法诊断的准确性,但是多站点间由于成像装置、成像参数和数据处理流程存在的差异造成的数据异质性影响往往被忽略。为了解决上述问题,本文提出了一种基于多视图低秩子空间的图结构学习多站点自闭症诊断方法(MVLL-GSL)。首先构建具有不同拓扑结构信息的多视图脑网络,然后分别将视图中不同类的样本分别投影到各自的低秩子空间,从而降低数据异质性的影响,最后使用图结构学习和多任务图嵌入学习相结合,并融入先验子网络和多视图一致性正则化约束,旨在从多视图低秩子空间中获得更具判别性和一致性的特征。使用自闭症公开数据库 ABIDE(Autism brain imaging data exchange)对提出的方法进行验证。实验结果表明,MVLL-GSL方法提高了ASD的诊断性能,并解释了不同先验子网络与ASD发病机制的关联性。
2024(4):996-1008. DOI: 10.16337/j.1004-9037.2024.04.018
摘要:解析膝关节运动意图是实现下肢外骨骼机器人穿戴舒适性的核心。神经系统疾病患者常伴有下肢运动障碍,通过表面肌电信号对其进行运动评估。为实现上述患者在运动评估与关节角度预测的融合,本文提出一种新型的基于注意力机制的CNN-LSTM网络模型,通过10通道表面肌电信号实现水平行走、上坡和上楼梯时3种日常运动膝关节角度预测,其预测误差指标均方根误差(Root mean square error, RMSE)、平均绝对误差(Mean absolute error, MAE)和决定系数(R2)均值分别为2.74、2.50和0.97,均优于传统网络模型。进一步,通过消融实验,显示上述3个预测指标分别平均下降了20.47%、34.36%和6.59%。可见,本文提出的基于注意力机制的CNN-LSTM模型端到端预测方法具有最高的预测精度,为下肢外骨骼机器人系统的人机交互控制方案提供了参考。
2024(4):1009-1019. DOI: 10.16337/j.1004-9037.2024.04.019
摘要:民航从业人员的身体健康状况是影响航空安全的重要因素,其中呼吸和心跳是极其重要的健康状况表征。为解决接触式或穿戴式测量系统对人员工作时的局限与影响,可采用线性调频连续波(Frequency-modulated continuous wave,FMCW)雷达达到非接触式测量的目的。由于生命体征信号具有时变、非平稳的特点,针对经验模态分解(Empirical mode decomposition,EMD)在信号分解中存在模态混叠现象的问题,使用时变滤波经验模态分解(Time varying filtering based on EMD,TVF-EMD)自适应信号的局部截止频率,可有效提高信号分离性能,解决模态混叠问题。利用TVF-EMD分解出的本征模态函数(Intrinsic mode functions,IMF)分量重构心跳对应的时域信号,估计心跳信号的频率和心跳节拍间隔(Inter-beat interval,IBI),进一步对心率变异性(Heart rate variability, HRV)相关指标进行估计。仿真实验与实测数据处理结果表明,TVF-EMD可从毫米波雷达测量信号中有效分离出呼吸与心跳信号。同时,从模态混叠程度及信号分离性能两方面对TVF-EMD与EMD方法分解效果进行了仿真分析,结果表明TVF-EMD能够有效解决模态混叠问题。因此,TVF-EMD方法能够准确有效地从毫米波雷达测量信号中提取生命体征信息,为IBI估计和HRV分析提供准确的时域信息,具有广阔的应用前景。
2024(4):1020-1032. DOI: 10.16337/j.1004-9037.2024.04.020
摘要:目前基于预训练-微调模式下的命名实体识别任务预训练与微调之间会出现差距,难以有效地对实体与上下文之间的关系进行建模,并且当前中文命名实体识别方法不能获取足够的字形或词义。针对上述问题,本文提出一种基于提示学习且融合多层级特征信息的命名实体识别方法。首先根据提示学习机制构建提示文本,再将输入文本的字符、词和实体级别特征信息与之拼接作为预训练模型的输入,以有效捕捉上下文之间的语义信息,缩小预训练模型与下游任务之间的差距,提高模型对命名实体识别的感知能力。本文提出的方法充分利用先验知识,提升模型的学习质量,提高在中文复杂多变语义环境下命名实体识别的效果。在人民日报、MSRA、Weibo、Resume和CMeEE数据集上的F1值分别达到了97.09%、96.68%、83.44%、97.48%和76.05%。实验结果表明,本文提出方法总体优于目前主流的中文命名实体识别方法。
2024(4):1033-1042. DOI: 10.16337/j.1004-9037.2024.04.021
摘要:轴承故障类型复杂,并且在不同工况下每种故障类型都很难获得足够的训练样本。因此,本文提出一种基于深度神经网络的小样本学习分类算法,引入第1层具有宽卷积核网络(Convolutional neural network with training interference,TICNN)作为孪生网络的子网络用于提取特征,减少工业环境噪声影响。孪生网络是一种常用于小样本学习的结构,通过输入相同或不同类别的样本对进行训练,学习不同属性样本与特征之间的映射关系,并采用相似度进行度量。测试样本通过寻找最近邻的类别来实现分类。在标准凯斯西储大学轴承故障诊断基准数据集上的实验结果表明,在数据有限的情况下,本文模型在故障诊断中表现出更好的效果。当使用最少的训练数据在不同的噪声环境中进行测试时,本文小样本学习模型的性能超过了具有合理噪声水平的基线模型,故障诊断准确率达到了94.41%。当在具有新故障类型或新工作条件的测试集上进行评估时,本文模型仍然有效。
您是本站第 访问者
通信地址:南京市御道街29号 南京航空航天大学(明故宫校区)
邮编:210016 传真:025-84892742
电话:025-84892742 E-mail:sjcj@nuaa.edu.cn
技术支持:北京勤云科技发展有限公司
网站版权: © 《数据采集与处理》 编辑部