• 2025年第40卷第4期文章目次
    全 选
    显示方式: |
    • “多模态医工融合”专栏序言

      2025, 40(4):845-845. DOI: 10.16337/j.1004-9037.2025.04.001

      摘要 (10) HTML (5) PDF 434.04 K (7) 评论 (0) 收藏

      摘要:

      • 0+1
      • 1+1
    • 弥散磁共振纤维束成像分割算法综述

      2025, 40(4):846-868. DOI: 10.16337/j.1004-9037.2025.04.002

      摘要 (5) HTML (7) PDF 1.81 M (4) 评论 (0) 收藏

      摘要:弥散磁共振成像(Diffusion magnetic resonance imaging, dMRI)作为一种先进的医学成像技术,能够在宏观层面上对活体大脑白质连接进行重建。该技术为量化描述大脑结构连接提供了重要的工具,能够使用连接性或者组织微观结构指标进行量化分析。在过去的20年里,使用弥散磁共振纤维束成像研究大脑连接已经成为神经影像学研究的重要方向。纤维束成像分割则是在量化分析大脑连接时定义不同量化区域的关键,它能够识别对量化大脑结构连接有意义的白质通路,并实现跨受试者的白质通路的定量比较。本文对纤维束分割方法进行了回顾,并按其技术路线归纳为两大类:一类是针对特定解剖纤维束的分割方法,聚焦于具有明确结构定义的通路(如弓状束、锥体束),适用于任务导向型分析与临床导航;另一类是全脑纤维束分割方法,强调数据驱动或图谱导向的结构划分,用于构建大规模结构连接网络和开展全脑层级分析。此外,本文还探讨了各类方法在适用性、准确性、可重复性与计算成本等方面的权衡。尽管自动化分割技术近年来取得显著进展,但目前的方法仍然无法兼顾准确性、泛化性和效率,在解剖一致性、方法标准化及结果可解释性方面仍存在挑战。基于数据驱动的深度学习方法在纤维束分割领域迅速发展,表现出色,有望在上述方面取得更大突破。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
    • 基于机器学习的脑影像基因组学分析方法综述

      2025, 40(4):869-886. DOI: 10.16337/j.1004-9037.2025.04.003

      摘要 (3) HTML (11) PDF 2.35 M (9) 评论 (0) 收藏

      摘要:脑影像基因组学是一个新兴的数据科学领域。在该领域中通过对脑影像数据与基因组数据(通常还结合其他生物标志物、临床数据及环境数据)进行综合分析,可以深入探究大脑的表型、遗传及分子特征,以及这些特征对正常和异常脑功能及行为的影响。鉴于机器学习在生物医学领域的作用日益重要,且脑影像基因组学相关文献迅速增长,本文对脑影像基因组学中机器学习方法进行了最新且全面的综述。本文首先回顾了脑影像基因组学的相关背景和基础工作;然后展示了基于多变量机器学习的脑影像基因组学关联研究的主要思想和建模,并提出了联合关联分析和结果预测的方法;最后对今后的工作进行了展望。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
    • 面向多模态心脏影像的多分支协同分割模型

      2025, 40(4):887-900. DOI: 10.16337/j.1004-9037.2025.04.004

      摘要 (7) HTML (7) PDF 2.50 M (5) 评论 (0) 收藏

      摘要:精确的心脏结构分割对于心脏血管疾病辅助诊断和术前的准确评估有着重要的意义。不同模态的影像之间在空间分布和语义表达上存在显著差异,但现有方法多采用单分支网络结构,难以充分融合多模态信息,在多模态任务上缺乏泛化能力。针对这一问题,提出一种融合状态空间模型Mamba与卷积模型的多分支协同分割网络MCNet(Multi-modal collaborative network)。该网络主要由3个模块构成:基于Mamba与卷积神经网络的双分支特征提取器、动态特征融合模块以及Mamba解码器。特征提取器的双分支分别侧重于提取全局语义与局部细节特征,动态特征融合模块根据图像动态调整多种融合路径的权重,从而实现不同分支的动态特征整合。本文提出的方法在心脏的MRI数据集ACDC与超声数据集CAMUS上进行了充分实验。实验结果表明,本文方法通过基于混合专家(Mixture of experts, MoE)机制的动态特征融合模块,动态调整Mamba全局特征和CNN局部特征的融合权重,在边界清晰的ACDC数据集中,平均Dice和交并比IoU分别达到0.845和0.779,在边界模糊的CAMUS数据集中的平均Dice和IoU分别达到0.883和0.796,均优于目前主流方法。同时,消融实验进一步验证了每个模块的有效性。MCNet通过MoE机制实时调整全局和局部特征的融合权重,在保证全局感知的同时提升了结构细节完整性,为多模态心脏影像分割提供了高效而鲁棒的解决方案。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
    • 离体小鼠大脑的高分辨率弥散磁共振成像技术研究

      2025, 40(4):901-911. DOI: 10.16337/j.1004-9037.2025.04.005

      摘要 (6) HTML (8) PDF 3.57 M (3) 评论 (0) 收藏

      摘要:在离体高分辨率弥散磁共振研究中,传统弥散加权自旋回波脉冲(Diffusion-weighted spin-echo pulse, DWI-SE)序列因扫描时间过长,难以满足大样本需求。多激发弥散加权平面回波成像(Multi-shot diffusion-weighted echo-planar imaging, MS-DWI-EPI)序列结合平面回波成像(Echo-planar imaging, EPI)读出和k空间分段采集,不仅显著提升了扫描效率,也有效缓解了单次EPI常见的图像畸变与失真问题。然而,MS-DWI-EPI在离体样本中的微观结构解析能力仍缺乏系统的验证。因此,本文使用3D DWI-SE序列和3D MS-DWI-EPI序列对离体小鼠大脑进行高分辨率弥散成像,并评估两种序列在信噪比、弥散张量成像(Diffusion tensor imaging, DTI)参数估计及纤维束追踪表现方面的差异。实验结果表明,在采集相同空间和角度分辨率的情况下,MS-DWI-EPI序列的扫描时间缩短了近50%,同时其原始b0图像的信噪比约为DWI-SE的3倍。在关键解剖区域,如胼胝体与海马区,MS-DWI-EPI不仅提升了DTI图像的结构对比度,而且改善了纤维束追踪的效果。该序列在成像效率与质量之间实现了良好平衡,为高通量微观结构研究提供了更高效的弥散加权成像协议。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
    • 基于3D多模态卷积网络与跨模态特征集成的阿尔茨海默症分类

      2025, 40(4):912-921. DOI: 10.16337/j.1004-9037.2025.04.006

      摘要 (6) HTML (8) PDF 1.51 M (3) 评论 (0) 收藏

      摘要:多模态神经影像技术为阿尔茨海默症(Alzheimer’s disease, AD)的早期精准诊断提供了重要的技术支撑。然而,由于不同模态神经影像数据在成像原理和特征表达上存在固有异质性,模态间的信息融合面临挑战。针对这一问题,提出了一种基于3D ResNet架构的多模态融合网络(Multi-modal fusion network, MFN),用于AD的早期辅助诊断。该方法首先采用3D ResNet网络分别提取T1加权和T2加权磁共振图像的特征表示,然后设计了一种创新的跨模态特征集成模块(Cross-modal feature integration module, CFIM)。相较于多模态数据直接串联,导致维度增长无法自适应调整模态权重的问题,CFIM 采用分阶段融合策略,包括全局信息融合模块、局部特征学习模块和关键因素模块。最后,融合后的多模态特征通过全连接神经网络进行分类决策。相比早期拼接的固定权重叠加和后期融合的浅层聚合,该策略能更精准地筛选出疾病诊断相关的特征。通过在阿尔茨海默症神经影像倡议(ADNI)数据库上的实验结果表明,与现有方法相比,本文方法在AD分类任务中具有较高的准确率和显著优势,且消融实验进一步验证了各模块的有效性,为多模态神经影像分析提供了新的技术思路。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
      • 11+1
      • 12+1
    • 基于多尺度注意力和图神经网络的多模态医学实体识别研究

      2025, 40(4):922-933. DOI: 10.16337/j.1004-9037.2025.04.007

      摘要 (7) HTML (8) PDF 1.38 M (3) 评论 (0) 收藏

      摘要:随着信息技术的快速发展,医疗健康领域中文文本、图像等多模态数据呈现出了爆发式增长。多模态医学实体识别(Multi-modal medical entity recognition, MMER)是多模态信息抽取的关键环节,近期受到了极大关注。针对多模态医学实体识别任务中存在图像细节信息损失和文本语义理解不足问题,提出一种基于多尺度注意力和图神经网络(Multi-scale attention and dependency parsing graph convolution,MADPG)的MMER模型。该模型一方面基于ResNet引入多尺度注意力机制,协同提取不同空间尺度融合的视觉特征,减少医学图像重要细节信息丢失,进而增强图像特征表示,补充文本语义信息;另一方面利用依存句法结构构建图神经网络,捕捉医学文本中词汇间复杂语法依赖关系,以丰富文本语义表达,促进图像文本特征深层次融合。实验表明,本文提出的模型在多模态中文医学数据集上F1值达到95.12%,相较于主流的单模态和多模态实体识别模型性能得到了明显提升。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
    • 基于U-Net和Transformer结合的不完整多模态脑肿瘤分割方法

      2025, 40(4):934-949. DOI: 10.16337/j.1004-9037.2025.04.008

      摘要 (5) HTML (8) PDF 4.07 M (4) 评论 (0) 收藏

      摘要:由于患者个体差异、采集协议多样性和数据损坏等因素,现有基于磁共振成像(Magnetic resonance imaging,MRI)的脑肿瘤分割方法存在模态数据丢失问题,导致分割精度不高。为此,本文提出了一种基于U-Net和Transformer结合的不完整多模态脑肿瘤分割(Incomplete multimodal brain tumor segmentation based on the combination of U-Net and Transformer,IM TransNet)方法。首先,针对脑肿瘤MRI的4个不同模态设计了单模态特定编码器,提升模型对各模态数据的表征能力。其次,在U-Net中嵌入双重注意力的Transformer模块,克服模态缺失引起的信息不完整问题,减少U-Net的长距离上下文交互和空间依赖性局限。在U-Net的跳跃连接中加入跳跃交叉注意力机制,动态关注不同层级和模态的特征,即使在模态缺失时,也能有效融合特征并进行重建。此外,针对模态缺失引起的训练不平衡问题,设计了辅助解码模块,确保模型在各种不完整模态子集上均能稳定高效地分割脑肿瘤。最后,基于公开数据集BRATS验证模型的性能。实验结果表明,本文提出的模型在增强型肿瘤、肿瘤核心和全肿瘤上的平均Dice评分分别为63.19%、76.42%和86.16%,证明了其在处理不完整多模态数据时的优越性和稳定性,为临床实践中脑肿瘤的准确、高效和可靠分割提供了一种可行的技术手段。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
      • 11+1
    • 基于参数共享的多特征图内外交互脑电图分类模型

      2025, 40(4):950-961. DOI: 10.16337/j.1004-9037.2025.04.009

      摘要 (7) HTML (11) PDF 1.50 M (5) 评论 (0) 收藏

      摘要:脑电图(Electroencephalography,EEG)信号分类在情感识别和脑机接口(Brain-computer interface,BCI)应用中具有关键意义。提出了一种参数共享的多特征图内外交互模型(Cross-map token attention,CMTA)。采用时空特征卷积神经网络(Spatial-temporal convolutional neural network,STCNN)对脑电图进行处理,生成多个脑电图特征图,每张特征图被视为一个token,传入参数共享的多模态模块MT(MLP和Transformer),其中多层感知器(Multi-layer perceptron,MLP)用于捕捉特征图内部的交互关系,Transformer则实现特征图之间的信息交互,从而提取更丰富的特征。通过一维自适应池化和全连接层构成的自适应分类器(Adapt-Classifier)完成脑电图的分类。实验结果表明,该方法在情感识别SEED数据集上的分类精度为98.86%,Kappa值为0.982 9;在运动分类BCI Competition IV Dataset 2a数据集上的分类精度为81.20%,Kappa值为0.748 4;在运动分类BCI Competition IV Dataset 2b数据集上的分类精度为86.55%,Kappa值为0.735 2。实验结果验证了所提方法在脑电图分类任务中的优越性能,并展示了其在不同EEG数据集上的广泛适用性。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
    • 基于噪声抑制的智能反射面辅助通信系统的信道估计研究

      2025, 40(4):962-971. DOI: 10.16337/j.1004-9037.2025.04.010

      摘要 (6) HTML (4) PDF 1.54 M (3) 评论 (0) 收藏

      摘要:针对用户设备到基站(Base station, BS)的视距通信受阻时智能反射面(Intelligent reflecting surface, IRS)辅助通信系统的信道估计任务,提出了一种基于潜在特征空间噪声抑制的神经网络,可以实现精确的信道估计。该神经网络将变分自编码器(Variational auto-encoder, VAE)模型和UNet模型相结合,能够在进行信道估计的同时对输入信号中的噪声进行处理。首先,VAE模型的输入是纯净的基站接收信号,以最小化估计的纯净的基站接收信号与其真实值之间的误差为目标,使VAE模型的编码器映射出一个特征向量,作为纯净接收信号的潜在表示。其次,固定VAE模型部分,使用纯净的基站接收信号作为UNet模型的输入对整个神经网络进行训练,在此过程中,VAE 模型学习到的纯净潜在特征向量有助于UNet模型的编码器学习到纯净的特征表示。接着,该特征被UNet模型的解码器解码以实现信道估计任务。最后,在估计阶段仅需利用UNet模型部分即可。仿真实验结果表明,本文所提出的信道估计方法可以有效抑制特征空间中的噪声信息,能以更低的时间复杂度更准确地估计出信道信息。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
    • 时空分布动态感知的校园共享单车众包调度系统

      2025, 40(4):972-985. DOI: 10.16337/j.1004-9037.2025.04.011

      摘要 (6) HTML (4) PDF 2.66 M (3) 评论 (0) 收藏

      摘要:共享自行车系统(Bike sharing system, BSS)已成为实施城市智能交通系统的一个重要组成部分。本文提出了一种时空分布动态感知的校园共享单车资源调度系统。该系统为了解决共享自行车站点库存突发变化所导致的库存紧张的问题,首先通过向量自回归滑动平均(Vector autoregressive moving average, VARMA)模型对自行车站点的动态变化情况进行建模,实现对站点未来时刻库存水平的预测,其次为了解决众包资源调度场景下自行车调度效用和开销的矛盾,提出了基于二分最优匹配模型的调度任务分配方法,并针对性优化了匈牙利算法实现任务分配决策的高效求解。仿真实验结果表明,本文提出的方法能够有效提高共享单车调度的系统效用,降低自行车站点因库存紧张导致的服务质量损失,有效平衡自行车时空分布。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
    • 耳罩式耳机接触压力对降噪量和舒适性的综合影响分析

      2025, 40(4):986-996. DOI: 10.16337/j.1004-9037.2025.04.012

      摘要 (4) HTML (5) PDF 2.86 M (3) 评论 (0) 收藏

      摘要:耳罩式耳机是一种与人体表面直接接触的声学穿戴设备,除了耳罩形状和材质,施加在耳罩上的夹紧力将直接影响耳罩在头皮表面的接触压力和降噪量,从而影响佩戴舒适和听觉舒适等体验。针对耳机产品接触压力难以测量和评估的问题,本文设计了一个给被试施加可调夹紧力的装置,同时采用一对压力胶片测量传递至头皮的接触压力。为了分析佩戴过程中的声学指标,在耳道口布置一对微缩传声器,用以捡拾和分析不同噪声环境下双耳噪声暴露剂量的衰减 (即降噪量),及其随夹紧力的变化。最后,结合舒适度量表,探讨了夹紧力、接触压力和降噪量等客观参数与舒适性主观感知之间的相关性,从而建议出合适的夹紧力设计范围。本文的实验方法和相关研究结论可为耳罩式耳机的夹紧力设计或评估提供一定的参考。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
      • 11+1
      • 12+1
      • 13+1
      • 14+1
    • 基于CR-NOMA的星空融合多用户传输性能分析

      2025, 40(4):997-1010. DOI: 10.16337/j.1004-9037.2025.04.013

      摘要 (5) HTML (3) PDF 1.66 M (3) 评论 (0) 收藏

      摘要:针对高空平台辅助的星空融合多用户场景,提出一种基于太赫兹和毫米波频段的新型混合无线传输方案,旨在提供异构用户可靠接入并解决卫星骨干网容量受限问题。首先,根据地面用户相关性和服务优先级进行分组,每组包含一个主用户和一个次级用户,次级用户采用认知非正交多址接入(Cognitive radio-based non-orthogonal multiple access, CR-NOMA)技术控制其发射功率,以确保不影响主用户的服务质量(Quality-of-service, QoS),而组间干扰则通过迫零波束成形技术加以消除。其次,在假设用户到高空平台采用毫米波传输技术,其信道服从Nakagami-m分布,而高空平台到卫星的传输采用太赫兹频段传输,其信道服从α-μ分布的条件下,推导出太赫兹频段传输存在指向误差时,采用该传输方案的用户中断概率和系统吞吐量的闭合表达式。最后,计算机仿真验证了理论分析的正确性及所提方案的优越性,并刻画相关参数对用户及系统性能的影响,从而为探索大容量的星空融合传输技术提供有益的参考。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
    • 无人机-车协同数据收集优化方法

      2025, 40(4):1011-1022. DOI: 10.16337/j.1004-9037.2025.04.014

      摘要 (3) HTML (4) PDF 1.64 M (3) 评论 (0) 收藏

      摘要:无人机(Unmanned aerial vehicle, UAV)作为移动的数据收集平台,凭其优越的机动性在无线传感器网络(Wireless sensor network, WSN)领域中具有重要的应用前景。为了解决无线传感器网络能耗大的问题,本研究面向传感器位置信息共享场景,提出了一种无人机-车协同数据收集优化方法以实现无人机非定点起降下的传感器能耗最小化的优化目标。该方法考虑了各传感器的调度问题,通过引入基于块坐标下降技术的凸优化算法迭代求解轨迹和唤醒策略交替优化中存在的混合整数非凸问题,在满足数据收集需求的同时最小化传感器节点(Sensor nodes, SNs)的能耗。仿真结果表明,本方法在典型传感器分布下能够有效降低无线传感器网络的能耗,展现了其在更复杂环境中的潜力,具有显著的适应性和扩展性。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
      • 11+1
    • 基于扩张注意力与深度最优化校正的多视图三维重建网络

      2025, 40(4):1023-1034. DOI: 10.16337/j.1004-9037.2025.04.015

      摘要 (3) HTML (4) PDF 2.20 M (3) 评论 (0) 收藏

      摘要:与CVP-MVSNet网络和CasMVSNet网络相比,MVSNet重建网络存在的内存消耗量问题降低了模型处理高分辨率图像时的内存消耗量以及重建点云的准确性误差,但是两者点云的完整性误差却很大。针对此问题,本文提出了基于扩张注意力与深度最优化校正的多视图三维重建网络DA-MVSNet。DA-MVSNet是以CasMVSNet作为基准网络,额外引入一个融合了深度可分离卷积的并行空洞卷积与注意力模块构成的特征增强网络,增强了重建网络对输入视图的全局特征捕获能力,提升了重建点云的完整度。为进一步提升输出深度图的精度,防止特征增强网络提取过多的视图非相关背景信息导致重建点云准确度的下降,在网络的输出部分还引入了一个基于非线性最小二乘的最优化校正机制模块。结果表明,DA-MVSNet重建网络在室内场景数据集DTU上运行得到的重建点云的准确性误差与完整性误差分别降低了2.5%和4.7%,具有较好的综合性能。但也由于额外引入了增强网络和校正机制,其内存和时间消耗均约高于CVP-MVSNet与CasMVSNet网络

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
      • 11+1
      • 12+1
    • 基于映射融合嵌入扩散模型的文本引导图像编辑方法

      2025, 40(4):1035-1045. DOI: 10.16337/j.1004-9037.2025.04.016

      摘要 (6) HTML (4) PDF 3.60 M (2) 评论 (0) 收藏

      摘要:在只有图像和目标文本提示作为输入的情况下,对真实图像进行基于文本引导的编辑是一项极具挑战性的任务。以往基于微调大型预训练扩散模型的方法,往往对源文本特征和目标文本特征进行简单的插值组合,用于引导图像生成过程,这限制了其编辑能力,同时微调大型扩散模型极易出现过拟合且耗时长的问题。提出了一种基于映射融合嵌入扩散模型的文本引导图像编辑方法(Text-guided image editing method based on diffusion model with mapping-fusion embedding, MFE-Diffusion)。该方法由两部分组成:(1)大型预训练扩散模型与源文本特征向量联合学习框架,使模型可以快速学习以重建给定的原图像;(2)特征映射融合模块,深度融合目标文本与原图像的特征信息,生成条件嵌入,用于引导图像编辑过程。在具有挑战性的文本引导图像编辑基准TEdBench上进行实验验证,结果表明所提方法在图像编辑性能上具有优势。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
      • 11+1
    • 基于空间连通特征和残差卷积神经网络的情绪脑电识别研究

      2025, 40(4):1046-1054. DOI: 10.16337/j.1004-9037.2025.04.017

      摘要 (3) HTML (3) PDF 2.09 M (2) 评论 (0) 收藏

      摘要:脑电信号(Electroencephalogram, EEG)作为一种客观直接的信息源,被广泛应用于情绪识别任务。为了提取脑电信号的空间连通特征所隐含的信息,提出了一种基于空间连通特征和残差卷积神经网络(Spatial connectivity features and residual convolutional neural network, SCF-RCNN)模型的情绪识别方法。该方法从经预处理的脑电信号中提取皮尔逊相关系数(Pearson correlation coefficient, PCC)、锁相值(Phase-locked value, PLV)和互信息(Mutual information, MI)作为空间连通特征,使用包含两个残差模块的卷积神经网络模型来提取情感信息。在SEED数据集上的实验结果显示,PLV构造的连接矩阵与脑电情绪关系更为密切,其平均准确率可达93.38%,标准差为3.35%。与传统算法相比,SCF-RCNN在情绪识别领域的分类任务中表现更为优越,表明该方法在情绪识别领域具有重要的应用潜力。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
    • 基于未校准眼动仪的无人机地面监控任务操作员分心检测

      2025, 40(4):1055-1064. DOI: 10.16337/j.1004-9037.2025.04.018

      摘要 (5) HTML (3) PDF 3.45 M (2) 评论 (0) 收藏

      摘要:在无人机地面监控任务中,操作员往往需要陷入长时间单调的等待,容易因分心造成失误。本文分析了校准对眼动信号的影响,并尝试在不进行校准的前提下使用眼动仪对操作员的分心状态进行评估。首先,模拟了多无人机协同搜索监督任务,构建包含22名被试的眼动数据集;接着提出一种与具体坐标位置无关的眼动速度矢量时序图方法,对未校准的眼动信号进行可视化定性分析;然后基于双均值聚类进行眼动行为检测,计算了速度相关与眼动行为相关的眼动特征;最后通过相关性分析与常见分类器上的分类验证,初步验证了使用未校准眼动仪进行分心状态检测的可行性。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
    • 基于改进Transformer的持续血糖浓度预测模型

      2025, 40(4):1065-1081. DOI: 10.16337/j.1004-9037.2025.04.019

      摘要 (3) HTML (3) PDF 2.89 M (2) 评论 (0) 收藏

      摘要:糖尿病是一种普遍存在的慢性疾病,做好血糖控制对糖尿病的预防具有重要作用。然而,持续血糖监测 (Continuous glucose monitoring,CGM)过程中数据的不确定性显著增加了血糖预测的难度。因此,提出一种新的基于深度学习的血糖浓度预测模型,旨在提高模型对传感器提取数据的适应性。在该模型中,堆叠式降噪自编码器(Stacked denoising auto encoder, SDAE)被嵌入Transformer编码器的结构中,实现对输入数据的重构去噪和特征提取;然后,采用混合位置编码策略替代原来的单一绝对位置编码嵌入,同时将轻量级解码器引入Transformer模型中,替代原始结构复杂的解码器,聚合来自不同层次的特征信息,同时获取局部和全局特征;最后,通过搭建的SDAE-改进Transformer网络对CGM数据序列并行化训练,更全面地捕捉数据中的时序模式和复杂关联,提高预测性能。实验结果表明,该模型相较于传统方法在血糖预测任务中取得了显著的性能提升,证实了其在处理CGM数据时的有效性和鲁棒性。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
      • 11+1
      • 12+1
    • 基于多尺度特征融合预处理与深度稀疏网络的并行磁共振成像重建

      2025, 40(4):1082-1095. DOI: 10.16337/j.1004-9037.2025.04.020

      摘要 (4) HTML (4) PDF 5.42 M (2) 评论 (0) 收藏

      摘要:磁共振成像(Magnetic resonance imaging, MRI)在医学诊断中具有关键作用,但过长的扫描时间可能会导致患者不适或产生运动伪影。并行成像技术和压缩感知理论表明,可通过对k空间数据进行欠采样从而提高扫描速度,其中并行MRI是一种通过利用多个接收线圈同时采集多个数据通道来加速成像过程的技术。深度学习凭借其强大的特征提取和模式识别能力,在欠采样MRI重建中展现出巨大的潜力。为克服现有技术的局限性(如需要自动校准信号、重建不稳定等),提出了一种创新的重建方法,旨在从欠采样的k空间数据中高效、准确地重建高质量的并行磁共振图像。该方法的核心骨架为深度稀疏网络,该网络通过将求解稀疏模型的迭代收缩阈值算法的迭代过程展开,转化为深度神经网络框架内的一系列可训练层。另外,还引入基于多尺度特征融合的自适应预处理模块,通过融合普通卷积与异型卷积核,进一步提升网络的稀疏表示能力。实验结果表明,相较于其他先进方法,本文提出的方法在多个数据集上均表现出更优的重建性能,包括更高的峰值信噪比和结构相似性指数,以及更低的高频误差范数。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
    • 面向语义增强的在线哈希方法

      2025, 40(4):1096-1106. DOI: 10.16337/j.1004-9037.2025.04.021

      摘要 (4) HTML (5) PDF 2.54 M (2) 评论 (0) 收藏

      摘要:传统的基于批处理的哈希学习方法通常无法满足大规模流数据实时在线检索的需求。在线哈希学习其核心在于无需重复访问原始累积数据,只为新增数据学习哈希码,并实时更新哈希函数以适应新旧数据的变化。现有在线哈希方法仍面临诸多挑战,如类间关系挖掘不足导致的语义偏移和新旧数据关联不足导致的遗忘问题。针对这些问题,本文提出了一种新的在线哈希学习方法——面向语义增强的在线哈希(Online semantic enhancement hashing, OSEH)。该方法通过设计三重矩阵分解框架,深入挖掘特征和标签间的交互关系,以生成反映类间关系的细粒度标签矩阵。同时,结合标签嵌入和成对相似性保持技术,将增强的语义信息有效融入哈希学习过程,优化哈希码的生成和哈希函数的实时更新。在大规模检索数据集上的实验结果表明,本文所提方法显著提升了在线哈希学习的性能。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
    • 基于互相关模板匹配算法的片式电子元器件自动检测与应用

      2025, 40(4):1107-1120. DOI: 10.16337/j.1004-9037.2025.04.022

      摘要 (4) HTML (5) PDF 3.89 M (3) 评论 (0) 收藏

      摘要:针对传统片式电子元器件人工检测效率低、误检率高等问题,提出了一种基于互相关模板匹配算法的片式电子元器件自动检测方法与系统。该系统利用互相关模板匹配算法,并结合四轴机械手视觉引导和底拍二次定位技术,实现了元器件的高效识别与精准抓取,并创新性地开发了旋转中心标定算法,有效补偿真空吸嘴同轴度误差。系统可兼容片式钽电容、0402封装瓷介电容器及SOD-323表贴二极管等器件,达到0.008 5 mm的定位精度。经实验验证,单次识别100只元器件耗时仅68 ms,正反面及极性识别准确率达100%。旋转中心标定使同轴度误差从0.4 mm降至0.008 mm,器件损伤率和抛料率分别控制在0.01%与0.02%,放料成功率为99.98%。相较传统人工检测,该系统检测效率提升5倍以上,为电子元器件自动检测提供了高精度、高可靠性的技术解决方案,推动了机器视觉在工业检测领域的应用创新。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
      • 11+1
      • 12+1
      • 13+1
      • 14+1
      • 15+1
      • 16+1
      • 17+1
快速检索
检索项
检索词
卷期检索