人工智能(机器学习与模式识别)

  • 显示方式:
  • 简洁模式
  • 摘要模式
  • 1  基于知识蒸馏的缅甸语光学字符识别方法
    毛存礼,谢旭阳,余正涛,高盛祥,王振晗,刘福浩
    2022, 37(1):173-182. DOI: 10.16337/j.1004-9037.2022.01.015
    [摘要](518) [HTML](1680) [PDF 1.40 M](1872)
    摘要:
    与传统的图像文本识别任务不同,缅甸语光学字符识别(Optical character recognition, OCR)需要计算机在一个感受野内识别由多个字符嵌套组合的复杂字符,这给缅甸语OCR任务带来了巨大的挑战。为了解决该问题,提出了一种基于知识蒸馏的缅甸语OCR方法,构建了使用卷积神经网络(Convolutional neural networks, CNN)+循环神经网络(Recurrent neural network, RNN)框架的教师网络和学生网络,以集成学习的方式进行训练的模型架构,在训练过程中通过教师集成的子网络与学生网络进行耦合,实现学生网络中单个感受野对应的局部字符图像特征与教师网络中整体字符图像特征的对齐,以此增强对长序列字符图像中局部特征的获取。实验结果表明,在没有背景噪声图像和有背景噪声图像作为训练数据集的情况下,本文模型的性能分别优于基线2.9%和2.7%。
    2  基于多标签学习的创伤救治层链决策研究
    赵鹏飞,刘华
    2022, 37(2):446-455. DOI: 10.16337/j.1004-9037.2022.02.017
    [摘要](659) [HTML](298) [PDF 725.83 K](1552)
    摘要:
    在现代创伤救治中,根据患者伤情进行合理而准确的院前评估并制定相应的救治决策对降低患者伤残率与死亡率具有重要意义。为了改善人工制定决策的缺陷,实现准确合理的标准化创伤救治决策制定,本文利用多标签学习思想,在对创伤救治决策进行深入分析与研究的基础上,将整体救治决策进行子决策划分,并提取出子决策对应的判定因素作为标签集。为了更好地考虑标签间的关联,将Classifier Chains算法的链式思想与多标签K近邻(Multi-label K-nearest neighbor,ML-KNN)算法融合,提出一种层链多标签学习算法,称为层链多标签K近邻算法(Layer chain ML-KNN,LCML-KNN)。LCML-KNN算法将标签依特点划分为两个层链,在第一层链的预测标签信息输出后对其进行独热编码,转化后的标签看作新特征放入第二层链进行预测与判断。LCML-KNN算法不仅更好地考虑了标签间的关联性,而且通过标签转化扩充了特征维数。在两个创伤类数据集上与现有各类多标签算法进行实验对比,结果验证了LCML-KNN算法的鲁棒性和优越性。
    3  基于局部特征的二维白化重构
    田甲略,朱玉莲,陈飞玥,刘佳慧
    2022, 37(2):308-320. DOI: 10.16337/j.1004-9037.2022.02.005
    [摘要](571) [HTML](1161) [PDF 3.45 M](1980)
    摘要:
    白化是一种能够去除数据各属性间相关性的数据预处理方法。最近提出的二维白化重构方法(Two-dimensional whitening reconstruction, TWR)是一种针对单张图片的白化方法,阐述了TWR方法等价于基于图像列的ZCA白化,即TWR具有去除图像列内相关性的作用;但是图像局部块内的相关性往往远大于列内,因此本文从去除图像局部块内相关性的角度出发,提出了两种TWR的改进方法:基于重组的TWR(Reshaped-based TWR, RTWR)方法和基于块的TWR(Patch-based TWR, PTWR)方法。RTWR首先将图像进行重新组合使得每个列向量对应着原始图像的子块,然后将TWR预处理作用在重组后的图像上;而PTWR方法则将TWR直接作用在图像的每个子块上。在ORL、CMU PIE、AR三个人脸数据集上的实验结果表明,RTWR和PTWR预处理比TWR预处理更有利于后续分类性能的提高。
    4  基于XGBoost的微博流行度预测算法
    任敏捷,靳国庆,王晓雯,陈睿东,袁运新,聂为之,刘安安
    2022, 37(2):383-395. DOI: 10.16337/j.1004-9037.2022.02.011
    [摘要](693) [HTML](1071) [PDF 1.60 M](2008)
    摘要:
    随着全媒体时代的到来和社交网络的发展,流行度预测在舆情监测和数据话语权的争夺上开始发挥重要的作用。现有的流行度预测研究多集中于外文媒体,对以微博为代表的国内主流媒体进行流行度预测是一个新兴且具有挑战的方向。本文针对微博这一国内社交媒体平台进行研究,通过对微博内容及微博用户的特征分析,设计了多种流行度预测方案,同时,提出了一种基于XGBoost的微博流行度预测算法,将流行度预测问题转换为互动值档位分类问题,在分类式框架下将提取融合后的特征用于模型训练,可以较为准确地对有用户信息的微博的流行度情况进行预测。本文的算法在微博流行度预测数据集中得到验证,并且取得了准确率高达85.69%的优越效果。
    5  基于深度学习的计算机视觉研究新进展
    卢宏涛,罗沐昆
    2022, 37(2):247-278. DOI: 10.16337/j.1004-9037.2022.02.001
    [摘要](2657) [HTML](3454) [PDF 12.48 M](4972)
    摘要:
    近年来,深度学习在计算机视觉各个领域中的应用成效显著,新的深度学习方法和深度神经网络模型不断涌现,算法性能被不断刷新。本文着眼于2016年以来的一些典型网络和模型,对基于深度学习的计算机视觉研究新进展进行综述。首先总结了针对图像分类的主流深度神经网络模型,包括标准模型及轻量化模型等;然后总结了针对不同计算机视觉领域的主流方法和模型,包括目标检测、图像分割和图像超分辨率等;最后总结了深度神经网络搜索方法。
    6  基于对比预测编码模型的多任务学习语种识别方法
    赵建川,杨浩铨,徐勇,吴恋,崔忠伟
    2022, 37(2):288-297. DOI: 10.16337/j.1004-9037.2022.02.003
    [摘要](587) [HTML](1369) [PDF 754.63 K](1725)
    摘要:
    语种识别的关键是从语音片段中提取有用的特征。通过延时神经网络(Time-delayed neural network, TDNN)可以提取包含丰富上下文信息的特征向量,有效提高系统性能。本文提出一种ECAPA(Emphasized channel attention)-TDNN+对比预测编码(Contrastive predictive coding,CPC)模型的多任务学习语种识别网络。ECAPA-TDNN为主干网络,提取语音全局特征,改进的CPC模型为辅助网络,对ECAPA-TDNN提取的帧级特征进行对比预测学习,通过联合损失函数进行优化训练。在东方语种竞赛数据集AP17-OLR的10类语种上进行了实验。实验结果表明,本文提出的网络在1 s,3 s和全长(All)测试集测得的识别准确率相比于基础网络都有明显的提高。
    7  基于多关系网络的话题意见领袖挖掘
    段震,倪云鹏,陈洁,张燕平,赵姝
    2022, 37(3):576-585. DOI: 10.16337/j.1004-9037.2022.03.008
    [摘要](503) [HTML](478) [PDF 1.41 M](4554)
    摘要:
    社交网络中的意见领袖在信息传播过程中起着重要的作用。传统的意见领袖挖掘仅基于网络结构,没有考虑特定话题或者事件下的作用,且目前基于话题的意见领袖挖掘仅基于单一的网络结构,并没有考虑到节点间的多种交互关系。本文提出一种基于多关系网络的话题意见领袖挖掘方法(Multi-relational networks, MRTRank),融合话题因素和节点间多种交互关系,通过一种属性网络表示学习算法,得到不同节点在多关系网络上的相似性,形成节点的转移概率矩阵,最终通过PageRank算法得到top-k个意见领袖。在真实Twitter数据集上的实验结果验证了本文提出的方法优于传统的意见领袖挖掘算法。
    8  基于特征扩展的微博短文本流热点话题检测方法
    李艳红,谢梦娜,王素格,李德玉
    2022, 37(3):621-632. DOI: 10.16337/j.1004-9037.2022.03.012
    [摘要](604) [HTML](334) [PDF 1.00 M](5283)
    摘要:
    随着社交网络和互联网的飞速发展,产生了大量的微博短文本流数据。及时发现微博文本流中热点话题,对话题推荐和舆情监测等有重要作用。为了解决微博短文本特征稀疏问题,利用微博评论对微博进行特征扩展,提出了一种基于特征扩展的微博短文本流热点话题检测方法(Feature extension-based hot topic detection, FE-HTD)。首先利用评论用户的影响力以及评论文本的点赞数筛选评论文本,并使用词共现和词频-逆文档频率(Term frequency-inverse document frequency,TF-IDF)方法从选取的评论文本中抽取特征词完成对微博文本的特征扩展;然后计算微博文本流的词对速度、词对加速度,并根据点赞数、评论数计算微博文本强度,结合词对加速度与微博文本强度定义突发特征;最后,根据突发词对的速度确定可变长的热点话题窗口范围,通过聚类得到窗口中热点话题的主题结构。实验中,将所提算法与基于文本的话题检测(Text-based topic detection, T-TD)和基于突发词的话题检测(Burst words-based topic detection, BW-TD)进行对比实验。结果表明,本文算法FE-HTD准确率达76.4%,召回率达78.7%,与对比算法T-TD和BW-TD相比提高了10%。
    9  基于粗糙超立方体和离散粒子群的特征选择算法
    王思朝,罗川,李天瑞,陈红梅
    2022, 37(3):668-679. DOI: 10.16337/j.1004-9037.2022.03.016
    [摘要](570) [HTML](275) [PDF 1.99 M](4867)
    摘要:
    特征选择指在保持数据分类性能不变的同时,选出不含冗余特征的特征子集。粗糙超立方体方法可从特征相关度、依赖度和重要度这3方面对特征子集进行综合评估,已成功用于特征选择。特征子集组合的计算是一个NP-难问题,而传统的前向搜索策略只能得到局部最优结果。因此,本文设计了一种新的离散粒子群优化与粗糙超立方体方法相结合的算法。该算法首先引入相关度用以生成一组粒子,然后对粗糙超立方体方法的目标函数改进后作为优化函数,最后由粒子群迭代优化,找到最优的特征子集。实验结果表明,相比传统粗糙超立方体方法和采用粒子群优化的粗糙集方法,本文算法能够得到具有更小特征数量和更高分类性能的特征子集。
    10  基于深度学习的域适应方法综述
    田青,朱雅喃,马闯
    2022, 37(3):512-541. DOI: 10.16337/j.1004-9037.2022.03.004
    [摘要](1300) [HTML](2619) [PDF 2.90 M](11067)
    摘要:
    域适应主要应对跨不同数据分布的相似任务决策问题。作为机器学习领域的一个新兴分支,域适应受到了众多的研究和关注。随着近年深度学习的兴起,深度学习和域适应相结合的深度域适应研究得到了更多的关注。尽管已有各种深度域适应方法被提出,却鲜有系统的综述工作发表。为此,本文重点对现有的深度域适应方法进行全面回顾、分析和总结,为相关研究人员提供借鉴和参考。本文主要贡献包括以下方面:首先,对域适应的背景、概念和应用领域进行概括总结。其次,根据模型是否涉及对抗训练机制,将现有深度域适应划分为深度对抗域适应和深度非对抗域适应两大类方法,并逐类回顾和分析。然后,对常用的实验基准数据集进行归类和总结。最后,对现有深度域适应工作存在的问题和不足进行了归纳分析,并讨论了将来的可行研究方向。
    11  基于几何-语义联合约束的动态环境视觉SLAM算法
    沈晔湖,陈嘉皓,李星,蒋全胜,谢鸥,牛雪梅,朱其新
    2022, 37(3):597-608. DOI: 10.16337/j.1004-9037.2022.03.010
    [摘要](1051) [HTML](637) [PDF 1.53 M](8660)
    摘要:
    传统视觉同步定位和地图构建(Simultaneous localization and mapping, SLAM)算法建立在静态环境假设的基础之上,当场景中出现动态物体时,会影响系统稳定性,造成位姿估计精度下降。现有方法大多基于概率统计和几何约束来减轻少量动态物体对视觉SLAM系统的影响,但是当场景中动态物体较多时,这些方法失效。针对这一问题,本文提出了一种将动态视觉SLAM算法与多目标跟踪算法相结合的方法。首先采用实例语义分割网络,结合几何约束,在有效地分离静态特征点和动态特征点的同时,进一步实现多目标跟踪,改善跟踪结果,并能够获得运动物体的轨迹和速度矢量信息,从而能够更好地为机器人自主导航提供决策信息。在KITTI数据集上的实验表明,该算法在动态场景中相较ORB-SLAM2算法精度提高了28%。
    12  基于深度学习的频分复用大规模多输入多输出下行信道状态信息获取技术
    桂冠,王洁,杨洁,刘淼,孙金龙
    2022, 37(3):502-511. DOI: 10.16337/j.1004-9037.2022.03.003
    [摘要](1050) [HTML](441) [PDF 1.82 M](8823)
    摘要:
    大规模多输入多输出(Multiple input multiple output, MIMO)技术的演进是第6代(The sixth generation, 6G)无线通信系统性能进一步提升的重要支撑。随着天线阵列规模的持续扩大,频分复用(Fvequency division duplexing, FDD)大规模MIMO系统获取下行信道状态信息(Channel state information, CSI)面临着严峻挑战。深度学习具有强大的学习及处理高维数据的能力,能够为解决这一挑战提供新的方案。本文综述了基于深度学习的FDD大规模MIMO下行CSI获取技术,包括CSI反馈和预测技术。首先给出了基于深度学习的CSI反馈和预测的原理框架,其次分析比较了国内外相关研究成果的优越性能,为解决面向6G的FDD大规模MIMO系统获取下行CSI问题提供了可行的参考方案。最后讨论了FDD大规模MIMO下行CSI获取的有待进一步解决的开放性问题以及所对应的潜在研究方案。
    13  基于粒计算的支持向量数据描述分类方法
    方宇,曹雪梅,杨梅,王轩,闵帆
    2022, 37(3):633-642. DOI: 10.16337/j.1004-9037.2022.03.013
    [摘要](827) [HTML](329) [PDF 1.21 M](7560)
    摘要:
    分类学习效果与有限训练样本的分布情况密切相关。支持向量数据描述(Support vector data description, SVDD)作为单一边界求解模型,不能良好刻画数据实际分布特征,从而导致部分目标对象落在超球以外。为了提高其分类能力,本文提出一种基于粒计算的支持向量数据描述(Granular computing-driven SVDD, GrC-SVDD)分类方法,构造多粒度层次的属性集合以及相应的多粒度超球。首先通过邻域自信息对当前粒度层的属性集合重要度进行计算,然后选择最佳属性集合对上一粒度层未达到纯度阈值的超球再训练,直到所有超球满足条件或者属性耗尽。实验部分讨论了算法参数对分类性能的影响,并通过学习获得超参数。结果表明,与SVDD及流行的分类算法相比,本文方法具有较好的分类性能。
    14  基于排序学习的城市设施选址方法
    韩文军,张亚平,陈红,陈丹,孙婉婷,赵斌
    2022, 37(3):609-620. DOI: 10.16337/j.1004-9037.2022.03.011
    [摘要](479) [HTML](386) [PDF 4.02 M](5949)
    摘要:
    提出一种采用排序学习技术解决城市设施选址问题的方法,并引入人类移动性特征提升选址的质量。首先对人类移动行为进行特征提取与分析,使用双流自编码器融合人类移动性特征与其他特征,提取表征向量;然后基于候选集的表征向量与排序学习网络进行地块排序;最后,基于真实的多源数据集进行实验,结果验证了本文提出的排序学习选址方法的有效性。
    15  融合主题模型和动态路由的小样本学习方法
    张淑芳,唐焕玲,郑涵,刘孝炎,窦全胜,鲁明羽
    2022, 37(3):586-596. DOI: 10.16337/j.1004-9037.2022.03.009
    [摘要](869) [HTML](540) [PDF 1.89 M](8307)
    摘要:
    针对小样本学习标注训练样本过少,导致特征表达力弱的问题,本文结合有监督主题模型(Supervised LDA, SLDA)和动态路由算法提出一种新的动态路由原型网络模型(Dynamic routing prototypical network based on SLDA, DRP-SLDA)。利用SLDA主题模型建立词汇与类别之间的语义映射,增强词的类别分布特征,从词粒度角度编码获得样本的语义表示。提出动态路由原型网络(Dynamic routing prototypical network,DR-Proto),通过提取交叉特征利用样本之间的语义关系,采用动态路由算法迭代生成具有类别代表性的动态原型,旨在解决特征表达问题。实验结果表明,DRP-SLDA模型能有效提取词的类别分布特征,且获取动态原型提高类别辨识力,从而能够有效提升小样本文本分类的泛化性能。
    16  用于迁移学习的多尺度领域对抗网络
    林佳伟,王士同
    2022, 37(3):555-565. DOI: 10.16337/j.1004-9037.2022.03.006
    [摘要](585) [HTML](713) [PDF 757.29 K](5396)
    摘要:
    深度学习算法的有效性依赖于大量的带有标签的数据,迁移学习的目的是利用已知标签的数据集(源域)来对未知标签的数据集(目标域)进行分类,因此深度迁移学习的研究成为了热门。针对训练数据标签不足的问题,提出了一种基于多尺度特征融合的领域对抗网络(Multi-scale domain adversarial network, MSDAN)模型,该方法利用生成对抗网络以及多尺度特征融合的思想,得到了源域数据和目标域数据在高维特征空间中的特征表示,该特征表示提取到了源域数据和目标域数据的公共几何特征和公共语义特征。将源域数据的特征表示和源域标签输入到分类器中进行分类,最终在目标域数据集的测试上得到了较为先进的效果。
    17  数据科学:从数字世界到数智世界
    张清华,高渝,申秋萍
    2022, 37(3):471-487. DOI: 10.16337/j.1004-9037.2022.03.001
    [摘要](1095) [HTML](670) [PDF 1.63 M](10027)
    摘要:
    随着大数据的持续发展,数据已经成为国家的重大战略资源,对社会影响日益明显。为了更深入地挖掘和研究大数据背后所蕴藏的基本科学问题,新的研究领域——数据科学被提出。本文从大数据的发展历程出发,介绍了数据科学的兴起和内涵;分析了大数据和数据科学的研究现状,以及数据在各行业中的应用;简述了为探索数据科学本身的内涵和规律而建设的大数据试验场;讨论了数据科学的关键问题,以及在研究数据时应具有的新思维和新观念,以推动数据科学的发展,促进现实世界向数字世界的转型,最终实现社会生活的真正智能化。
    18  雷达辐射源信号分选识别特征性能评价的改进灰色关联模型
    普运伟,吴海潇,姜萤,余永鹏
    2022, 37(3):657-667. DOI: 10.16337/j.1004-9037.2022.03.015
    [摘要](478) [HTML](316) [PDF 1.45 M](2030)
    摘要:
    为解决雷达辐射源信号分选识别特征评价不够客观和缺乏评价依据等问题,构建了一种结合区间直觉模糊思想的改进灰色关联的特征评价模型。该模型引入信噪比维度来考察不同层次数据的动态差异,以区间型数据描述特征信息,建立区间直觉模糊综合决策矩阵;其次,采用特征间总离差最大化的优化模型来确定各指标权重;最后基于改进灰色关联框架,结合逼近理想点方法实现特征方案排序。仿真实验结果表明,所提方法能够给出与实际情况相一致的分选识别特征评价排序结果,并和未改进的灰色关联法分析结果基本一致,验证了所提方法的可行性和有效性。
    19  基于关键词结构编码的涉案微博评价对象抽取模型
    王静赟,余正涛,相艳,陈龙
    2022, 37(5):1026-1035. DOI: 10.16337/j.1004-9037.2022.05.008
    [摘要](424) [HTML](278) [PDF 960.79 K](1460)
    摘要:
    涉案微博评价对象抽取旨在从微博评论中识别出用户评价的案件对象词项,有助于掌握大众对于特定案件不同方面的舆论。现有方法通常将评价对象抽取视为一个序列标注任务,但并未考虑涉案微博的领域特点,即评论通常围绕正文中出现的案件关键词展开讨论。为此,本文提出一种基于关键词结构编码的序列标注模型,进行涉案微博评价对象抽取。首先从微博正文中获取多个案件关键词,并使用结构编码机制将其转换为关键词结构表征,然后将该表征通过交互注意力机制融入评论句子表征,最后利用条件随机场(Conditional random field, CRF)抽取评价对象词项。在两个案件的数据集上进行了实验,结果表明:相较于多个基线模型,本文方法性能得以提升,验证了所提方法的有效性。
    20  可解释的深度TSK模糊系统综述
    王士同,谢润山,周尔昊
    2022, 37(5):935-951. DOI: 10.16337/j.1004-9037.2022.05.001
    [摘要](1290) [HTML](645) [PDF 840.68 K](3585)
    摘要:
    深度神经网络在多个领域取得了突破性的成功,然而这些深度模型大多高度不透明。而在很多高风险领域,如医疗、金融和交通等,对模型的安全性、无偏性和透明度有着非常高的要求。因此,在实际中如何创建可解释的人工智能(Explainable artificial intelligence, XAI)已经成为了当前的研究热点。作为探索XAI的一个有力途径,模糊人工智能因其语义可解释性受到了越来越多的关注。其中将高可解释的Takagi-Sugeno-Kang(TSK)模糊系统和深度模型相结合,不仅可以避免单个TSK模糊系统遭受规则爆炸的影响,也可以在保持可解释性的前提下取得令人满意的测试泛化性能。本文以基于栈式泛化原理的可解释的深度TSK模糊系统为研究对象,分析其代表模型,总结其实际应用场景,最后剖析其所面临的挑战与机遇。
    21  基于两阶段分层抽样的近似聚合查询方法
    房俊,赵博,左昌麒
    2022, 37(5):1049-1058. DOI: 10.16337/j.1004-9037.2022.05.010
    [摘要](604) [HTML](565) [PDF 1.41 M](1612)
    摘要:
    以数据仓库应用为代表的交互式查询分析技术为智能决策提供了支持。随着数据规模的不断增大,准确计算聚合查询结果往往需要全局数据扫描,使得这类查询面临着实时响应能力不足的问题。基于预先抽取的样本数据,复杂聚合查询提供快速的近似答案,在许多场景下是解决该问题的可行方案。分析了分层抽样优于随机抽样的具体条件,提出了一种两阶段分层抽样方法。首先针对业务特征进行分组,每个分组中使用随机抽样方法进行随机抽样,并评估其抽样效果。再针对抽样效果较差的分组,利用自组织特征映射网络(Self-organizing feature mapping,SOM)对数值进行聚类分组,改进其近似查询效果。基于公开数据集和实际电网数据的实验结果表明:本文方法相比于随机抽样、分层随机抽样以及国会抽样算法在相同抽样率下可达到15%的性能提升;与使用K-means、基于密度的聚类算法(Density-based spatial clustering of applications with noise,DBSCAN)等聚类方法相比,自SOM具有较好的近似查询结果。
    22  主成分分析阈值选择差异性分析研究
    张婧,刘倩
    2022, 37(5):1012-1017. DOI: 10.16337/j.1004-9037.2022.05.006
    [摘要](608) [HTML](491) [PDF 1.77 M](1893)
    摘要:
    主成分分析是特征提取和数据降维中常用的方法,在很多应用中一般选择平均特征值作为主成分选择的标准。但是主成分的多少与应用结果之间的关系目前还没有具体的分析结果。因此,提出一种主成分阈值选择差异性的实验分析方法,为不同应用中主成分分析阈值的选择提供依据。将本文分析方法应用于手写数字样本集MNIST进行降维处理,根据不同的阈值构建不同的神经网络进行分类,分析不同阈值下分类准确率的变化情况。实验结果表明主成分阈值选择在79%~81%之间(维度为41~50)时,分类准确率最高;低于或高于该区间,准确率随之下降。实验结果证明了主成分分析阈值的选择与应用结果之间不为正相关关系,且平均特征值不是一个硬性的选择标准。
    23  改进的自步深度不完备多视图聚类
    崔金荣,黄诚
    2022, 37(5):1036-1048. DOI: 10.16337/j.1004-9037.2022.05.009
    [摘要](568) [HTML](362) [PDF 1.96 M](2006)
    摘要:
    随着数据量的增大,多视图聚类中出现带有缺失视图数据的情况愈发常见,此问题被称为不完备多视图聚类,而引入深度模型进行聚类通常可以获得比浅层模型更为出色的表现。本文提出一种新颖的深度不完备多视图聚类模型,称为改进的自步深度不完备多视图聚类。在该模型中,充分考虑多视图数据之间的互补性,利用基于多视图特性的最近邻填充方案将缺失视图补全。使用多个自编码器分别获取多个视图数据的低维潜在特征,同时引入图嵌入策略保持潜在特征之间的几何结构。运用一致性原则将来自不同的视图潜在特征融合以获得一致潜在特征,在此基础上运用自步学习的方法来增强聚类效果。实验结果表明,对比现有的不完备多视图聚类模型,本文模型可以更加灵活且高效地应对各种不完备多视图聚类情况,提升了不完备多视图聚类的鲁棒性与表现效果。
    24  深度学习在有限视角稀疏采样光声图像重建中的应用
    孙正,候英飒
    2022, 37(5):971-983. DOI: 10.16337/j.1004-9037.2022.05.001
    [摘要](927) [HTML](506) [PDF 4.04 M](3817)
    摘要:
    光声成像(Photoacoustic imaging, PAI)是一种多物理场耦合的新型功能成像技术,高质量图像重建是提高成像精度的关键。当探测器采集的光声信号数据不完备时,若采用标准重建方法(如反投影、时间反演和延迟求和等)会导致图像质量以及成像深度的下降。迭代重建算法可在一定程度上解决此问题,但存在计算成本高、需合理选择正则化方法等缺点。近年来,深度学习已经成为医学成像领域的首选方法,其在高效率重建高质量图像方面展现出了巨大潜力。本文对深度学习在有限角度稀疏采样光声图像重建中的应用进展进行总结,对主要方法进行分类归纳,并讨论不同方法的优势和不足。
    25  基于相同稀疏模式的稀疏主成分分析算法
    邵剑飞,浦蓉,黄伟,季建杰,郭鹏
    2022, 37(5):1084-1091. DOI: 10.16337/j.1004-9037.2022.05.013
    [摘要](664) [HTML](272) [PDF 966.74 K](1472)
    摘要:
    稀疏主成分分析是一种用于降维和特征选择的无监督方法。由于计算多个主成分时主载荷向量间不具有相同的稀疏模式,导致难以从原始特征空间中确定出对主成分贡献最大的小部分变量,为解决此问题,提出一种自适应稀疏主成分分析(Adaptive sparse principal component analysis, ASPCA)算法。首先使用组套索模型,通过在载荷向量上施加块稀疏约束得出自适应稀疏主成分分析公式,随后对稀疏矩阵的不同列使用不同的调整参数获得自适应惩罚,最后运用块坐标下降法对自适应稀疏主成分分析公式进行两阶段优化,从而找到稀疏载荷矩阵和正交矩阵,实现降维的最优化。对稀疏主成分分析(Sparse principal component analysis, SPCA)算法、结构化且稀疏的主成分分析(Structured and sparse principal component analysis, SSPCA)算法和ASPCA算法进行仿真比较,结果表明ASPCA算法的降维性能更优,能提取更有价值的特征,从而显著提高了分类模型的平均分类准确率。