2022, 37(5):935-951. DOI: 10.16337/j.1004-9037.2022.05.001
摘要:深度神经网络在多个领域取得了突破性的成功,然而这些深度模型大多高度不透明。而在很多高风险领域,如医疗、金融和交通等,对模型的安全性、无偏性和透明度有着非常高的要求。因此,在实际中如何创建可解释的人工智能(Explainable artificial intelligence, XAI)已经成为了当前的研究热点。作为探索XAI的一个有力途径,模糊人工智能因其语义可解释性受到了越来越多的关注。其中将高可解释的Takagi-Sugeno-Kang(TSK)模糊系统和深度模型相结合,不仅可以避免单个TSK模糊系统遭受规则爆炸的影响,也可以在保持可解释性的前提下取得令人满意的测试泛化性能。本文以基于栈式泛化原理的可解释的深度TSK模糊系统为研究对象,分析其代表模型,总结其实际应用场景,最后剖析其所面临的挑战与机遇。
2022, 37(5):952-970. DOI: 10.16337/j.1004-9037.2022.05.002
摘要:随着无人机软硬件技术的发展,多无人机集群自组织形成的无人机自组网(Flying Ad-Hoc networks, FANETs)受到了越来越多的来自学术界和工业界的关注,其灵活的部署和快速的反应能力使其能高效地完成多种多样的任务。而无人机自组网路由协议是提高服务质量(Quality of service, QoS)最重要的方法之一,但无人机自组网的移动性和动态性给路由协议的设计带来了严峻的挑战。传统的移动路由协议不能很好地满足无人机自组网的路由需求,因此研究者们从基于拓扑、地理和分层的角度提出了各式各样的无人机自组网路由协议,旨在克服移动性和提高网络的服务质量,并指出未来无人机自组网的路由协议可以考虑机会路由、软件定义网络(Software defined network,SDN)决策和预测驱动决策等综合提高QoS。本文主要针对无人机自组网网络特征,从不同的路由方法出发,SDN对路由协议进行总结和归纳,并对未来的研究方向进行了展望。
2022, 37(5):971-983. DOI: 10.16337/j.1004-9037.2022.05.001
摘要:光声成像(Photoacoustic imaging, PAI)是一种多物理场耦合的新型功能成像技术,高质量图像重建是提高成像精度的关键。当探测器采集的光声信号数据不完备时,若采用标准重建方法(如反投影、时间反演和延迟求和等)会导致图像质量以及成像深度的下降。迭代重建算法可在一定程度上解决此问题,但存在计算成本高、需合理选择正则化方法等缺点。近年来,深度学习已经成为医学成像领域的首选方法,其在高效率重建高质量图像方面展现出了巨大潜力。本文对深度学习在有限角度稀疏采样光声图像重建中的应用进展进行总结,对主要方法进行分类归纳,并讨论不同方法的优势和不足。
2022, 37(5):984-996. DOI: 10.16337/j.1004-9037.2022.05.004
摘要:针对传统隐私保护机器学习方案抵抗对抗攻击能力较弱的特点,提出一种基于格雷码置乱和分块混沌置乱的医学影像加密方案(Gray + block chaotic scrambling optimized for medical image encryption,GBCS),并应用于隐私保护的分类挖掘。首先对图像进行位平面切割;然后,对图像不同位平面进行格雷码置乱后再进行分块,在分块的基础上分别进行混沌加密;最后通过深度网络对加密后的图像进行分类学习。通过在公开乳腺癌和青光眼数据集上进行交叉验证仿真实验,对GBCS 的隐私保护与分类性能进行量化分析,并从图像直方图、信息熵和对抗攻击能力等指标考虑其安全性。实验结果表明医学图像在GBCS 加密前后的性能差距在可接受范围内,方案能更好地平衡性能与隐私保护的矛盾, 能有效抵御对抗样本的攻击,验证了本文方法的有效性。
2022, 37(5):997-1011. DOI: 10.16337/j.1004-9037.2022.05.005
摘要:概念漂移处理大多采用集成学习策略,然而这些方法多数不能及时提取漂移发生后新分布数据的关键信息,导致模型性能较差。针对这个问题,本文提出一种基于串行交叉混合集成的概念漂移检测及收敛方法(Concept drift detection and convergence method based on hybrid ensemble of serial and cross,SC_ensemble)。在流数据处于平稳状态下,该方法通过构建串行基分类器进行集成,以提取代表数据整体分布的有效信息。概念漂移发生后,在漂移节点附近构建并行的交叉基分类器进行集成,提取代表最新分布数据的局部有效信息。通过串行基分类器和交叉基分类器的混合集成,该方法兼顾了流数据包含的整体分布信息,又强化了概念漂移发生时的重要局部信息,使集成模型中包含了较多“好而不同”的基学习器,实现了漂移发生后学习模型的高效融合。实验结果表明,该方法可使在线学习模型在漂移发生后快速收敛,提高了模型的泛化性能。
2022, 37(5):1012-1017. DOI: 10.16337/j.1004-9037.2022.05.006
摘要:主成分分析是特征提取和数据降维中常用的方法,在很多应用中一般选择平均特征值作为主成分选择的标准。但是主成分的多少与应用结果之间的关系目前还没有具体的分析结果。因此,提出一种主成分阈值选择差异性的实验分析方法,为不同应用中主成分分析阈值的选择提供依据。将本文分析方法应用于手写数字样本集MNIST进行降维处理,根据不同的阈值构建不同的神经网络进行分类,分析不同阈值下分类准确率的变化情况。实验结果表明主成分阈值选择在79%~81%之间(维度为41~50)时,分类准确率最高;低于或高于该区间,准确率随之下降。实验结果证明了主成分分析阈值的选择与应用结果之间不为正相关关系,且平均特征值不是一个硬性的选择标准。
2022, 37(5):1018-1025. DOI: 10.16337/j.1004-9037.2022.05.007
摘要:针对混合属性离群点检测问题,提出基于邻域近似精度的混合属性离群点检测方法。首先,定义异构邻域关系度量来表示混合数据之间的近邻性。然后,定义一种特定的邻域近似精度来构建邻域粒离群度。进而,定义基于邻域近似精度的离群因子及提出基于邻域近似精度的离群点检测(Nighborhood approximation accuracy-based outlier detection, NAAOD)。最后,用UCI数据集对NAAOD算法的有效性进行了验证。理论研究和实验结果均表明,NAAOD算法对混合属性离群点检测是有效的。
2022, 37(5):1026-1035. DOI: 10.16337/j.1004-9037.2022.05.008
摘要:涉案微博评价对象抽取旨在从微博评论中识别出用户评价的案件对象词项,有助于掌握大众对于特定案件不同方面的舆论。现有方法通常将评价对象抽取视为一个序列标注任务,但并未考虑涉案微博的领域特点,即评论通常围绕正文中出现的案件关键词展开讨论。为此,本文提出一种基于关键词结构编码的序列标注模型,进行涉案微博评价对象抽取。首先从微博正文中获取多个案件关键词,并使用结构编码机制将其转换为关键词结构表征,然后将该表征通过交互注意力机制融入评论句子表征,最后利用条件随机场(Conditional random field, CRF)抽取评价对象词项。在两个案件的数据集上进行了实验,结果表明:相较于多个基线模型,本文方法性能得以提升,验证了所提方法的有效性。
2022, 37(5):1036-1048. DOI: 10.16337/j.1004-9037.2022.05.009
摘要:随着数据量的增大,多视图聚类中出现带有缺失视图数据的情况愈发常见,此问题被称为不完备多视图聚类,而引入深度模型进行聚类通常可以获得比浅层模型更为出色的表现。本文提出一种新颖的深度不完备多视图聚类模型,称为改进的自步深度不完备多视图聚类。在该模型中,充分考虑多视图数据之间的互补性,利用基于多视图特性的最近邻填充方案将缺失视图补全。使用多个自编码器分别获取多个视图数据的低维潜在特征,同时引入图嵌入策略保持潜在特征之间的几何结构。运用一致性原则将来自不同的视图潜在特征融合以获得一致潜在特征,在此基础上运用自步学习的方法来增强聚类效果。实验结果表明,对比现有的不完备多视图聚类模型,本文模型可以更加灵活且高效地应对各种不完备多视图聚类情况,提升了不完备多视图聚类的鲁棒性与表现效果。
2022, 37(5):1049-1058. DOI: 10.16337/j.1004-9037.2022.05.010
摘要:以数据仓库应用为代表的交互式查询分析技术为智能决策提供了支持。随着数据规模的不断增大,准确计算聚合查询结果往往需要全局数据扫描,使得这类查询面临着实时响应能力不足的问题。基于预先抽取的样本数据,复杂聚合查询提供快速的近似答案,在许多场景下是解决该问题的可行方案。分析了分层抽样优于随机抽样的具体条件,提出了一种两阶段分层抽样方法。首先针对业务特征进行分组,每个分组中使用随机抽样方法进行随机抽样,并评估其抽样效果。再针对抽样效果较差的分组,利用自组织特征映射网络(Self-organizing feature mapping,SOM)对数值进行聚类分组,改进其近似查询效果。基于公开数据集和实际电网数据的实验结果表明:本文方法相比于随机抽样、分层随机抽样以及国会抽样算法在相同抽样率下可达到15%的性能提升;与使用K-means、基于密度的聚类算法(Density-based spatial clustering of applications with noise,DBSCAN)等聚类方法相比,自SOM具有较好的近似查询结果。
2022, 37(5):1059-1069. DOI: 10.16337/j.1004-9037.2022.05.011
摘要:针对目前中文事件检测中词语之间句法依存关系利用不充分和缺乏文章全局语义信息的问题,提出了一种基于句法和全文信息增强的中文事件检测模型。模型首先引入图卷积网络 (Graph convolutional network, GCN),通过捕获词语之间的依存句法关系来增强词语的特征表示。之后采用双向门控循环单元(Bidirectional gate recurrent unit, Bi-GRU)分别学习句子内和句子之间的上下文信息,得到包含文章全局信息的句向量。最后将字、词、句3个粒度的信息通过门结构进行动态融合,使用条件随机场(Conditional random field, CRF)完成对句子中触发词的识别和标注。在ACE2005和CEC中文数据集上的实验结果表明,本文方法有效提升了中文事件检测的效果。
2022, 37(5):1070-1083. DOI: 10.16337/j.1004-9037.2022.05.012
摘要:由于安防设备硬件条件等因素制约,在视频监控场景下的低清人脸检测中注重模型在检测精度、速度以及占用内存大小等方面的权衡已然是必须考虑的问题。针对此问题,将可变形卷积(Deformable convolution,DC)和Lambda层进行融合,提出一种轻型尺度自适应深度网络的低清人脸检测模型DLFace。首先借鉴RetinaFace算法,使用改进后的深度可分离卷积能够有效防止训练过程中信息丢失;其次将改进后的可变形卷积引入骨干网络和SSH (Single stage headless) 检测模块,通过增强感受野适应人脸多因素的变化;最后在骨干网络高层引入Lambda层,有效挖掘语义和位置信息,形成更加丰富的特征表示。在WiderFace数据集上的实验结果表明,DLFace实现了性能和速度的平衡,在不同场景下均验证了DLFace的优越性,表明DLFace能较好地适用于视频监控场景下的低清人脸检测任务。
2022, 37(5):1084-1091. DOI: 10.16337/j.1004-9037.2022.05.013
摘要:稀疏主成分分析是一种用于降维和特征选择的无监督方法。由于计算多个主成分时主载荷向量间不具有相同的稀疏模式,导致难以从原始特征空间中确定出对主成分贡献最大的小部分变量,为解决此问题,提出一种自适应稀疏主成分分析(Adaptive sparse principal component analysis, ASPCA)算法。首先使用组套索模型,通过在载荷向量上施加块稀疏约束得出自适应稀疏主成分分析公式,随后对稀疏矩阵的不同列使用不同的调整参数获得自适应惩罚,最后运用块坐标下降法对自适应稀疏主成分分析公式进行两阶段优化,从而找到稀疏载荷矩阵和正交矩阵,实现降维的最优化。对稀疏主成分分析(Sparse principal component analysis, SPCA)算法、结构化且稀疏的主成分分析(Structured and sparse principal component analysis, SSPCA)算法和ASPCA算法进行仿真比较,结果表明ASPCA算法的降维性能更优,能提取更有价值的特征,从而显著提高了分类模型的平均分类准确率。
2022, 37(5):1092-1100. DOI: 10.16337/j.1004-9037.2022.05.014
摘要:模糊的超声图像经过极端通道先验去模糊后不够稀疏,导致极端通道稀疏约束可能不存在。因此,为了充分利用图像通道信息,通过增强去模糊后超声图像的稀疏性,提出一种二次稀疏极端通道先验盲超声图像去模糊算法。首先,给出了相关的理论证明和实验说明二次稀疏极端通道先验用于约束模糊超声图像的可行性;然后,充分利用暗通道和亮通道的先验信息,在交替迭代过程中采用半二次分裂方法估计中间图像和模糊核;最后,用傅里叶变换求得最终的清晰图像和模糊核。在超声图像集上的实验结果表明,本文提出的二次稀疏极端通道先验盲超声图像去模糊算法和其他超声图像去模糊方法相比更具可行性和优越性。
2022, 37(5):1101-1116. DOI: 10. 16337/j. 1004-9037. 2022. 05. 015
摘要:跨社交平台的用户身份解析是社交网络一个重要的研究方向,其可以有效集成不同平台的同一用户信息。现有的用户身份解析工作大多针对类型相似的社交平台,平台间的信息相对对称,通过用户在不同平台上的档案属性、空间位置、网络关系等信息的相似度来判别是否为同一用户。然而,在两个异构社交平台中用户信息是不对称的,难以直接获取到用于用户身份解析的相应属性信息。本文研究跨评论类与活动类平台间的用户身份解析方法。为了解决两类社交平台的用户信息属性不对称问题,把用户信息按档案属性、语义序列、特征词序列3类信息组织,从各自的社交平台中抽取相应的信息建立映射关系,提出了综合3类信息的集成匹配算法。考虑了用户活动的时间偏移现象,采用反向传播学习的方法获取时间偏移权重,提出了基于反向传播学习的语义序列与特征词序列相似性度量方法。同时,设计了总体相似度度用于用户身份解析。利用真实数据集进行了充分的实验,实验结果表明了所提出用户身份解析算法的有效性。
2022, 37(5):1115-1125. DOI: 10.16337/j.1004-9037.2022.05.016
摘要:目前来自采集中心的具有自杀倾向的重度抑郁症(Major depressive disorder, MDD)患者脑功能影像存在异质性,从而造成的计算瓶颈影响了分析可靠性。为此,本文借助同质化多站点算法,试图扩充MDD患者静息态功能磁共振成像(Resting-state functional magnetic resonance imaging,rfMRI)的样本体量,探究自杀倾向对MDD脑功能网络的影响。实验纳入3个站点、共99例MDD患者(包括非自杀倾向(Non-suicidal MDD,nMDD)67例、自杀倾向(Suicidal MDD,sMDD)32例)及72例健康对照(Healthy controls,HC)组rfMRI数据,计算Pearson相关性的功能连接并由ComBat技术同质化多站点功能连接;以小世界属性为稀疏度判别标准,以功能连接为边建立脑网络并进行图论分析;在节点度、节点效率指标上采用多重比较校正进行组间显著性对比。实验结果表明,同质化有效清除了站点间功能连接异质性。在小脑下半月小叶及蚓锥体,sMDD组较nMDD组和HC组皆具有组间显著性(pFDR<0.05),即存在自杀倾向导致的异常脑功能活动。该研究克服了多站点的MDD患者的小样本缺陷,有效地提取了自杀倾向患者脑功能影像标记,有助于评估自杀风险。
2022, 37(5):1126-1133. DOI: 10.16337/j.1004-9037.2022.05.017
摘要:分子机器是指由分子尺度的物质构成且能行使某种加工功能的机器,主要构件是蛋白质等生物分子。三维空间结构决定了蛋白质的相关特性和功能,理解蛋白质的氨基酸(残基)序列如何折叠成特定的三维空间结构,即蛋白质结构的折叠机制及其特性对于分子机器的研究具有重要意义。因此,使用一种快速简单的研究蛋白质结构折叠机制信息的模拟方法很有必要。本文主要基于蛋白质的自然状态拓扑,采用高斯网络模型研究了蛋白质GB1,分析了其结构特性及其结构的展开过程,与相关实验和分子动力学模拟数据吻合良好,表明该弹性网络模型适用于蛋白质结构的研究。
2022, 37(5):1134-1144. DOI: 10.16337/j.1004-9037.2022.05.018
摘要:针对论文引用预测方法在特征稀疏时性能下降的问题,提出了基于异构特征融合的方法,可同时利用定长特征、引文网络特征和引文时序特征,有效提升了引用预测方法的精度。本文针对论文引用预测任务定义了引文属性网络,对3类异构特征进行建模;提出了面向异构特征融合的论文引用预测方法,使用图神经网络处理定长特征和引文网络特征,使用循环神经网络处理引文时序特征,基于多头注意力机制对提取到的异构特征进行融合并预测被引次数。在大规模真实数据集上的实验表明,本文方法可以有效利用多种异构特征并缓解数据稀疏问题,均方根误差(Root mean squatr error,RMSE)比最好的基准方法降低了0.31。
2022, 37(5):1145-1156. DOI: 10.16337/j.1004-9037.2022.05.019
摘要:为了解决现有虚拟试衣方法不能适用于学位服的问题,提出一种面向学位服照片生成的虚拟试衣方法。该方法首先对由服装变形模块和虚拟试穿模块构成的基于图像的虚拟试衣网络进行训练,将人像与学位服图像通过训练后的网络生成试衣结果。随后,将生成的学位服试衣结果通过背景融合模块与特定背景进行合成。实验过程中,本文构建了一个新的学位服与长裙的数据集。从实验结果来看,本文提出的算法能够在很大程度上减少原人像中衣服对学位服试穿的影响,能够较好地完成学位服的试穿工作并生成较为理想的试穿结果。
2022, 37(5):1157-1168. DOI: 10.16337/j.1004-9037.2022.05.020
摘要:针对现有的脉冲超宽带(Impulse radio ultra wideband, IR-UWB)系统中到达时间(Time-of-arrival, TOA)和波达方向(Direction-of-arrival, DOA)联合估计精度不足的问题,提出了一种基于离散傅里叶变换(Discrete Fourier transform, DFT)的TOA和DOA联合估计方法。该算法首先在频域上对接收信号建模,通过DFT处理频域接收信号的协方差矩阵得到两根天线的TOA粗估计结果。然后通过设计补偿矩阵对时延向量进行相位补偿。搜索可得粗估计结果的补偿值,进一步对TOA参数作出精确估计。最后根据两根天线的到达时间差与DOA之间的关系得到信号的DOA估计值,从而实现TOA和DOA的联合估计。仿真结果表明,所提算法的参数估计性能优于矩阵束算法和传统传播算子算法,且该优势随着信噪比的增大更为明显;同时所提算法无需复杂的特征值分解以及广义逆求解步骤,更易于工程实现。
2022, 37(5):1169-1178. DOI: 10.16337/j.1004-9037.2022.05.021
摘要:合并单元设备监控依赖于现场工作人员记录、实践经验以及预设告警阈值,缺少对系统监视数据的分析和挖掘,不能实现设备状态预测。鉴于此,根据监视合并单元电平数据的时序性特征,将传统时序模型差分整合移动平均自回归(Autoregressive integrated moving average, ARIMA)和长短期记忆网络(Long short-term memory, LSTM)构建组合模型,并采用蛙跳算法 (Shuffled frog leaping algorithm, SFLA) 进行模型优化。优化后的模型应用在合并单元激光器监视的电平数据预测分析,将ARIMA-LSTM优化组合模型和单一模型进行对比,验证了组合模型比单一模型具有更高的准确度。进一步和其他组合模型做对比实验,实验结果表明,组合模型经过SFLA优化后均优于其他组合模型,能够更好挖掘数据中的隐藏信息和趋势,提高时序数据预测精度和故障排查效率。将SFLA优化的组合ARIMA-SVM模型和ARIMA-LSTM模型对比,实验结果表明,所提出的ARIMA-LSTM模型优于ARIMA-SVM模型,可以更好地分析和掌握设备状态信息,实现对合并单元设备的电平数据预测。
您是本站第 访问者
通信地址:南京市御道街29号 南京航空航天大学(明故宫校区)
邮编:210016 传真:025-84892742
电话:025-84892742 E-mail:sjcj@nuaa.edu.cn
技术支持:北京勤云科技发展有限公司
网站版权: © 《数据采集与处理》 编辑部