推荐文章

傅彬，柏业超

2024, 39(6):1310-1325. DOI: 10.16337/j.1004-9037.2024.06.002

[摘要](597) [HTML](294) [PDF 2.54 M](393)

摘要:
在海杂波背景的信号检测问题中，由于海杂波具有明显的非平稳特性，其统计特性随时间改变，传统的统计信号处理方法无法取得最优效果。现有的非平稳信号处理方法主要包括基于统计模型的方法和基于时间序列分析的方法。从统计模型的角度出发，目前最常用的是使用复合高斯（Compound Gaussian， CG）分布对海杂波进行建模。从时间序列分析的角度出发，目前有使用时变自回归（Time-varying autoregressive， TVAR）模型、广义自回归条件异方差（Generalized autoregressive conditional heteroskedasticity， GARCH）模型、随机波动（Stochastic volatility， SV）模型等对非平稳信号进行建模的方法。本文对上述非平稳信号处理方法进行对比研究，并通过仿真实验验证其运用在海杂波背景下信号检测问题中的可行性。上述方法均可以一定程度上准确描述海杂波的部分特性，但是难以通过这些方法设计易于实现的检测器，还需进一步研究面向海杂波背景下检测问题的非平稳信号建模表征方法。

2 分布式麦克风阵列拾音理论与应用方法综述

张结，呼德，张晓雷，凌震华

2024, 39(5):1085-1113. DOI: 10.16337/j.1004-9037.2024.05.004

[摘要](1213) [HTML](820) [PDF 2.65 M](916)

摘要:
经过数十年的发展，麦克风阵列技术日益成熟，并广泛应用于视频会议、智能电视、移动通话和助听器等人机交互系统。然而，现实噪声或远距离交互场景中，限定阵型结构的传统麦克风阵列的拾音质量难以保证。随着无线智能终端设备的广泛使用，分布式麦克风阵列（或称无线声传感器网络）为提升复杂开放域语音交互系统的拾音质量提供了更多可能性，并在阵列组织、应用体验和声场覆盖度上更有优势。近年来，分布式麦克风阵列在很多语音交互任务上展现出良好的应用潜力，基本实现了对传统麦克风阵列语音任务的全覆盖。本文将重点总结现阶段分布式麦克风阵列的拾音理论和应用方法，包括阵列组织原理、麦克风节点效用评估，以及结合下游语音任务阐述其应用方法。最后，将简要论述分布式麦克风阵列走向实用的关键挑战与发展趋势。

3 基于深度学习的说话人确认方法研究现状及展望

李建琛，韩纪庆

2024, 39(5):1062-1084. DOI: 10.16337/j.1004-9037.2024.05.003

[摘要](731) [HTML](569) [PDF 1.60 M](775)

摘要:
随着深度学习的不断发展，说话人确认（Speaker verification）技术已经取得了长足的进步。该技术相较于其他生物特征识别技术，具有可远程操作、成本低和易于人机交互等优势，在公安刑侦、金融服务等领域展现出广泛的应用前景。本文系统综述了基于深度学习的说话人确认技术的发展脉络。首先，介绍了基于深度学习的说话人特征表示模型在模型输入与结构、池化层、有监督损失函数和自监督学习与预训练模型4个方面的发展历程和研究现状；其次，探讨了说话人确认技术在实际应用中面临的跨域不匹配问题，如噪声干扰、信道不匹配和远场语音等，并概述了相应的领域自适应和领域泛化方法；最后，指出了进一步的研究方向。

4 多说话人分离与目标说话人提取的研究现状与展望

鲍长春，杨雪

2024, 39(5):1044-1061. DOI: 10.16337/j.1004-9037.2024.05.002

[摘要](1466) [HTML](893) [PDF 2.33 M](818)

摘要:
语音分离作为语音信号处理领域的前沿技术，具有重要的研究价值和广阔的应用前景。通常，麦克风拾取的信号包含有多个说话人的语音、噪声和混响。为了提升用户的听觉体验以及后端设备的处理性能，需要对混合信号进行语音分离。语音分离起源于著名的鸡尾酒会问题，旨在从混合信号中分离出说话人的语音信号。近年来，研究人员提出了大量的语音分离方法，显著提升了分离性能。本文对这些语音分离方法进行了系统的归纳和总结。首先，根据目标说话人的辅助信息利用与否，将语音分离方法分为两大类，即多说话人分离与目标说话人提取；其次，从传统到基于深度学习的角度，分别对多说话人分离和目标说话人提取两类方法进行详细介绍；最后，讨论了当前语音分离领域面临的一些挑战，并对未来的研究方向进行展望。

5 人工智能辅助的磁共振成像在评估乳腺癌新辅助化疗中的应用综述

刘凯文，金莹莹，王守巨

2024, 39(4):794-812. DOI: 10.16337/j.1004-9037.2024.04.003

[摘要](716) [HTML](649) [PDF 2.75 M](787)

摘要:
新辅助化疗已成为乳腺癌标准治疗策略，而磁共振成像是评估乳腺癌对新辅助化疗反应的首选影像学方法。虽然磁共振成像能提供关于肿瘤位置、大小及微环境等详细信息，但肿瘤的多样性变化给乳腺癌新辅助化疗的精准评估带来挑战。基于机器学习和深度学习的人工智能方法展现出识别磁共振成像数据中复杂模式的能力。通过临床影像特征分析、影像组学分析和生境分析等方法，人工智能技术已显著提升乳腺癌新辅助化疗评估的性能和效率，有助于实现个性化治疗策略。本文介绍了乳腺癌新辅助化疗评估所用的磁共振成像数据及性能指标，总结了人工智能技术在此领域的应用进展，同时探讨了当前人工智能技术在实际应用中的挑战和未来可能的研究方向。

6 弥散磁共振成像在中医诊疗中的机遇与挑战

吴烨，和岚翔，张鑫媛，伏云鹤，刘小明，何建忠

2024, 39(4):776-793. DOI: 10.16337/j.1004-9037.2024.04.002

[摘要](627) [HTML](760) [PDF 937.74 K](619)

摘要:
弥散磁共振成像（Diffusion magnetic resonance imaging，dMRI）是一种通过测量水分子在不同方向上的弥散情况来获取微观结构信息的先进医学影像技术，在临床辅助诊疗中的应用日益广泛。在中医诊疗领域，dMRI技术同样展现了其独特的潜力和价值，为中医“辨证施治”提供了更为客观的依据。在中医诊疗中，dMRI不仅能够帮助医生更准确地诊断疾病，还能监测疾病的发展过程以及治疗效果，为中医“治未病”和“个体化治疗”提供了有力的支持。然而，dMRI技术在中医诊疗领域的应用也面临着诸多挑战。本文集中回顾了近几年dMRI技术在中医诊疗中的应用，并探讨了高级dMRI技术在中医诊疗领域的广阔前景和潜力，同时也讨论了当前dMRI应用的局限性以及dMRI在中医诊疗应用中的挑战。本研究将促进医工交叉，尤其是中医-智能影像技术领域的交流与合作，并推动dMRI技术在中医诊疗中的深入应用和发展。

7 垂直领域大模型的定制化：理论基础与关键技术

陈浩泷，陈罕之，韩凯峰，朱光旭，赵奕晨，杜滢

2024, 39(3):524-546. DOI: 10.16337/j.1004-9037.2024.03.003

[摘要](2039) [HTML](1294) [PDF 2.11 M](2758)

摘要:
随着 ChatGPT 等基于大模型的产品展现出强大的通用性能，学术界和工业界正积极探索如何将这些模型适配到特定行业和应用场景中，即进行垂直领域大模型的定制化。然而，现有的通用大模型可能无法完全适配特定领域数据的格式，或不足以捕捉该领域的独特需求。因此，本文旨在探讨垂直领域大模型定制化的方法论，包括大模型的定义和类别、通用架构的描述、大模型有效性背后的理论基础，以及几种可行的垂直领域大模型构建方法，期望通过这些内容为相关领域的研究者和从业者在垂直领域大模型定制化方面提供指导和参考。

8 大语言模型评估技术研究进展

赵睿卓，曲紫畅，陈国英，王坤龙，徐哲炜，柯文俊，汪鹏

2024, 39(3):502-523. DOI: 10.16337/j.1004-9037.2024.03.002

[摘要](1411) [HTML](643) [PDF 1.54 M](3163)

摘要:
随着大语言模型的广泛应用，针对大语言模型的评估工作变得至关重要。除了大语言模型在下游任务上的表现情况需要评估外，其存在的一些潜在风险更需要评估，例如大语言模型可能违背人类的价值观并且被恶意输入诱导引发安全问题等。本文通过分析传统软件、深度学习模型与大模型的共性与差异，借鉴传统软件测评和深度学习模型评估的指标体系，从大语言模型功能评估、性能评估、对齐评估和安全性评估几个维度对现有工作进行总结，并对大模型的评测基准进行介绍。最后依据现有研究与潜在的机遇和挑战，对大语言模型评估技术方向和发展前景进行了展望。

9 多粒度三支决策研究进展

钱进，郑明晨，周川鹏，刘财辉，岳晓冬

2024, 39(2):361-375. DOI: 10.16337/j.1004-9037.2024.02.009

[摘要](639) [HTML](385) [PDF 2.79 M](1189)

摘要:
多粒度三支决策利用三支决策理论，从多视角、多层次对复杂问题进行数据分析与处理，逐渐成为一种高效、可靠的智能决策方法。本文对多粒度三支决策的研究工作进行综述，主要介绍了多粒度融合策略、多视角三支决策和多层次三支决策，以及从定性和定量两个角度探讨了多粒度三支决策，讨论了不同多粒度三支决策模型之间的关系，并指出了多粒度三支决策研究中存在的若干问题，为该领域的深入研究提供参考。

10 计算成像在全息存储相位恢复中的应用研究进展

郝建颖，林雍坤，刘宏杰，陈瑞娴，宋海洋，林达奎，林枭，谭小地

2024, 39(2):297-311. DOI: 10.16337/j.1004-9037.2024.02.004

[摘要](635) [HTML](461) [PDF 5.25 M](4616)

摘要:
全息存储技术作为一种三维体存储、二维面数据传输的数据存储技术，具有存储密度高、数据传输快等特点，是解决海量数据长期存储的有力方案之一。传统全息存储方法受到光电探测器只对强度响应的限制，通常采用纯振幅编码进行调制，但仅利用振幅信息无法完全发挥全息技术本身优势，如何简单快速、稳定精确地解码相位信息是全息存储技术面临的现实问题。计算成像因其算法多变、高感知维度等特点为全息存储技术的相位恢复问题提供了新的思路。本文主要从迭代计算相位恢复和深度学习相位重建角度回顾近年来利用计算成像技术解决全息存储相位恢复问题的一些工作，从存储密度提升、数据读取速度提升以及数据读取稳定性等角度对工作进行了分析，并对该方向未来发展做出展望。

11 计算成像技术中的点扩散函数工程

乔敏达，白林阁，王书恒，王天宇，董雪，相萌，刘飞，刘金鹏，邵晓鹏

2024, 39(2):271-296. DOI: 10.16337/j.1004-9037.2024.02.003

[摘要](1507) [HTML](1199) [PDF 8.93 M](1596)

摘要:
围绕光学成像中点扩散函数（Point spread function， PSF）在计算成像中的新内涵与应用，介绍了传统光学成像中PSF的概念以及PSF在光学系统设计中关键作用，并简要说明了几种利用PSF恢复图像算法以及图像评价指标。在此基础上以计算成像框架下信息传递的视角重新审视了PSF的内涵，从狭义、广义光学系统两个方面对计算成像领域中的相关研究进行了归纳总结，最后展望了PSF工程技术的应用前景及发展趋势。

12 计算增强光学相干层析成像技术研究进展

乔正钰，黄勇，郝群

2024, 39(2):248-270. DOI: 10.16337/j.1004-9037.2024.02.002

[摘要](815) [HTML](581) [PDF 8.05 M](1153)

摘要:
光学相干层析成像（Optical coherence tomography， OCT）作为一种重要的无损断层三维成像技术，应用场景广泛。不断发展的场景需求对OCT技术的性能提出了新的要求，包括分辨率提升、焦深解耦、像差校正及分辨率各向异性改善等。在过去的十几年内，一系列基于计算成像的方法被证明能有效实现上述性能提升。本文围绕上述OCT成像4个性能提升需求，总结综述了代表性的计算成像方法。分析对比了相应计算成像方法之间的优劣，并对未来发展趋势进行展望，旨在为计算成像方法在 OCT 领域的进一步研究与应用提供参考。

13 信号调制识别的对抗样本攻防技术研究进展

江汉，胡林，李文，焦雨涛，徐煜华，徐逸凡

2023, 38(6):1235-1256. DOI: 10.16337/j.1004-9037.2023.06.001

[摘要](1324) [HTML](855) [PDF 1.90 M](1898)

摘要:
对调制识别的对抗样本攻击这一研究热点进行了综述，首先给出调制识别中对抗样本的的相关概述和专业术语，将对抗样本攻击和防御方法的相关研究成果进行梳理回顾，并对现有对抗攻击方法进行分类，阐述了其生成机理。针对在无线通信场景下对抗攻击所面临的挑战，梳理了调制识别任务下的对抗样本攻击现有关键技术，深入分析了调制识别对抗样本攻击的防御技术。最后，依据现有研究与潜在的机遇和挑战，结合人工智能算法的各项优势，对下一代智能无线通信中对抗攻击的技术方向和发展前景进行了展望。

14 ChatGPT大模型技术发展与应用

夏润泽，李丕绩

2023, 38(5):1017-1034. DOI: 10.16337/j.1004-9037.2023.05.002

[摘要](1333) [HTML](1110) [PDF 2.15 M](1391)

摘要:
通过回顾深度学习、语言模型、语义表示和预训练技术的发展历程，全面解析了ChatGPT的技术渊源和演进路线。在语言模型方面，从早期的N-gram统计方法逐步演进到神经网络语言模型，通过对机器翻译技术的研究和影响也催生了Transformer的出现，继而又推动了神经网络语言模型的发展。在语义表示和预训练技术发展方面，从早期的TF-IDF、pLSA和LDA等统计方法发展到Word2Vec等基于神经网络的词向量表示，继而发展到ELMo、BERT和GPT-2等预训练语言模型，预训练框架日益成熟，为模型提供了丰富的语义知识。GPT-3的出现揭示了大语言模型的潜力，但依然存在幻觉问题，如生成不可控、知识谬误及逻辑推理能力差等。为了缓解这些问题，ChatGPT通过指令学习、监督微调、基于人类反馈的强化学习等方式在GPT-3.5上进一步与人类进行对齐学习，效果不断提升。ChatGPT等大模型的出现，标志着该领域技术进入新的发展阶段，为人机交互以及通用人工智能的发展开辟了新的可能。

15 音频隐写方法综述：从传统到深度学习

张雄伟，葛晓义，孙蒙，宋宫琨琨，李莉

2023, 38(5):995-1016. DOI: 10.16337/j.1004-9037.2023.05.001

[摘要](1213) [HTML](1089) [PDF 1.93 M](2173)

摘要:
数字音频作为网络空间中广泛应用的媒体，是承载秘密信息的良好载体，常被用来构建实时性强、复杂度低、不可感知性好的隐蔽通信。音频隐写作为确保网络信息安全和数据保密通信的关键技术手段之一，正受到越来越多学者的关注。本文对音频隐写方法的发展脉络进行了系统性梳理。首先，介绍了音频隐写的基本内容，对问题描述、常用数据格式、工具和评价指标等进行总结。其次，按照嵌入域的不同，将传统音频隐写方法分为时域方法、变换域方法和压缩域方法，并分析其优缺点；根据隐写载体的不同，将基于深度学习的隐写方法划分为嵌入载体式、生成载体式和无载体式音频隐写，并对这3种音频隐写方法进行了对比分析。最后，指出了当前音频隐写进一步的研究方向。

16 基于深度学习的自动睡眠分期研究综述

刘颖，储浩然，章浩伟

2023, 38(4):759-776. DOI: 10.16337/j.1004-9037.2023.04.002

[摘要](1485) [HTML](1151) [PDF 5.02 M](2091)

摘要:
睡眠分期是为了分析多导睡眠图记录而进行的重要过程，在睡眠监测和睡眠障碍诊疗中发挥着关键作用。传统的手动睡眠分期需要专业知识，繁琐且耗时；而深度学习通过模拟人脑解释信息的机制来构建模型，具有强大的自动特征提取及特征表达功能。将深度学习方法应用于睡眠分期研究，不依赖于手工特征设计，能够实现睡眠分期的自动化。本文着眼于2017年以来的一些典型的自动睡眠分期研究，重点从单视图和多视图输入两个方面系统回顾了应用于自动睡眠分期中的深度学习模型，并分析了多视图模型存在的难点，指出了其具有的潜在研究价值。最后，对自动睡眠分期未来的研究方向进行了探讨。

17 基于机器学习的超声造影分析综述

万鹏，刘晗，赵俊勇，薛海燕，刘春蕊，邵伟，孔文韬，张道强

2023, 38(4):741-758. DOI: 10.16337/j.1004-9037.2023.04.001

[摘要](968) [HTML](911) [PDF 3.62 M](1570)

摘要:
超声造影（Contrast-enhanced ultrasound， CEUS）通过外周静脉注入超声造影剂，显著增强来自肿瘤微血管的血流信号，便于临床医生以实时、动态的方式评估肿瘤血管生成、周边浸润等，广泛应用于多器官病变诊断、预后评估和治疗方案规划等方面。近年来，以深度学习为代表的机器学习方法快速发展，为动态超声造影智能分析带来新的机遇。深度学习方法很大程度上拓宽了超声造影临床应用范围，提高了其诊疗效能。但与常规超声影像类似，超声造影仍然存在斑点噪声、呼吸运动干扰和标准化程度低等问题，使得动态灌注时间、空间信息挖掘面临挑战。本文系统性回顾了近年来超声造影智能分析相关工作，涵盖良恶性鉴别、恶性分级、疗效预测和诊疗方案选择等方面应用，总结了当前影像组学及深度学习方法在超声造影分析领域的最新进展，并指出当前研究的局限性和未来发展方向。

18 无人机集群网络资源优化综述

田畅，贾倩，陈润丰，王海超，李国鑫，焦雨涛

2023, 38(3):506-524. DOI: 10.16337/j.1004-9037.2023.03.002

[摘要](1369) [HTML](955) [PDF 1.59 M](2097)

摘要:
无人机集群以其灵活性、低成本和可搭载各类传感器等优势，已成为执行复杂任务的关键设备，其应用依赖于及时高效的通信，因此针对无人机集群网络的研究近年来也得到了广泛关注。无人机集群高移动性、高信息交互量和低能源存储量等固有特性，使其通信资源的管理面临各种严峻的挑战。本文首先综述了无人机集群网络的应用场景、优势及其特点，并结合信道接入控制体制，对无人机集群的无线资源优化问题进行分类，提炼出资源优化所面临的挑战。随后从策略与方法的角度对现有的网络资源优化方案进行了总结归纳，梳理了大规模集群场景下的通信性能提升、高动态环境下的及时决策更新，以及多元异构需求下的通信满意度提升等技术难点。最后，依据研究现状与潜在机遇，结合新兴技术的应用优势，对无人机集群网络的技术方向和发展前景进行了展望。

19 图文跨模态检索研究进展

张飞飞，马泽伟，周玲，孟铃涛

2023, 38(3):479-505. DOI: 10.16337/j.1004-9037.2023.03.001

[摘要](1547) [HTML](1172) [PDF 3.48 M](3685)

摘要:
随着互联网技术的迅速发展，文本和图像等各种类型的数据在网络上呈现爆发式增长，如何从这些多源异构且语义关联的多模态数据中获取有价值的信息则尤为重要。跨模态检索能够突破模态的限制，跨越不同模态的数据进行信息检索，满足用户获取有关事件信息的需求。近年来，跨模态检索已经成为了学术界和工业界研究的热点问题。本文聚焦于图文跨模态检索任务，首先介绍图文跨模态检索的定义，并分析说明了当前该任务面临的挑战。其次，对现有的研究方法进行归纳总结，将其分为3大类：（1）传统方法；（2）基于深度学习的方法；（3）基于哈希表示的方法。然后，详细介绍了图文跨模态检索的常用数据集，并对常用数据集上已有算法进行详细分析与比较。最后，对图文跨模态检索任务的未来发展方向进行展望。

20 基于粒计算的多源信息融合方法综述

徐伟华，黄旭东，蔡可

2023, 38(2):245-261. DOI: 10.16337/j.1004-9037.2023.02.002

[摘要](995) [HTML](1008) [PDF 1.33 M](2281)

摘要:
多源数据是一种综合多个信息源或数据集的复杂数据类型，其主要特点是不同的信息源隐含不同的知识结构，且从不同的角度刻画和描述了样本以及样本之间的关系。如何协同地融合与集成多源数据，并从不同视角快速地为用户挖掘出整体决策知识，成为数据科学领域亟待破解的科学问题。经典粗糙集理论、多粒度方法、证据理论和信息熵是常见的、有效的多源信息融合方法，已取得较为丰硕的成果。本文基于粒计算的角度对多源信息融合工作进行综述研究，介绍了每种信息融合方法的基本概念以及主要研究思路，并提出了多源信息融合领域中存在的若干问题，为该领域的后续研究提供理论参考。

21 海洋极端天气现象预测方法研究进展

刘安安，李天宝，宋丹，李文辉，孙正雅，袁春鑫

2023, 38(2):231-244. DOI: 10.16337/j.1004-9037.2023.02.001

[摘要](1060) [HTML](1043) [PDF 1.05 M](2281)

摘要:
海洋极端天气对沿海地区影响重大。研究人员利用海洋大数据，结合深度学习算法，在海洋极端天气现象预测方面取得了重要进展。本文首先以典型的多尺度海洋极端天气现象——厄尔尼诺、台风及短临降雨为例，介绍了近年来主流的海洋极端天气现象预测算法，即基于模式计算的方法和基于人工智能的算法。然后分析了海洋极端天气现象智能预测的挑战和机遇，详细总结了各类方法的研究进展，并且通过数据和实验讨论了现有算法的优点和不足。最后展望了基于海洋大数据的海洋极端天气现象智能预测的发展方向。

22 基于深度学习的显著性目标检测综述

孙涵，刘译善，林昱涵

2023, 38(1):21-50. DOI: 10.16337/j.1004-9037.2023.01.002

[摘要](1980) [HTML](906) [PDF 5.89 M](4490)

摘要:
显著性目标检测通过模仿人的视觉感知系统，寻找最吸引视觉注意的目标，已被广泛应用于图像理解、语义分割、目标跟踪等计算机视觉任务中。随着深度学习技术的快速发展，显著性目标检测研究取得了巨大突破。本文总结了近5年相关工作，全面回顾了3类不同模态的显著性目标检测任务，包括基于RGB图像、基于RGB-D/T（Depth/Thermal）图像以及基于光场图像的显著性目标检测。首先分析了3类研究分支的任务特点，并概述了研究难点；然后就各分支的研究技术路线和优缺点进行阐述和分析，并简单介绍了3类研究分支常用的数据集和主流的评价指标。最后，对基于深度学习的显著性目标检测领域未来研究方向进行了探讨。

23 跨模态视觉问答与推理研究进展

张飞飞，张建庆，屈思佳，周琬婷

2023, 38(1):1-20. DOI: 10.16337/j.1004-9037.2023.01.001

[摘要](1222) [HTML](1013) [PDF 1.95 M](2855)

摘要:
随着社交媒体和人机交互技术的快速发展，视频、图像以及文本等多模态数据在互联网中呈爆炸式增长，因此多模态智能研究受到关注。其中，视觉问答与推理任务是跨模态智能研究的一个重要组成部分，也是人类实现人工智能的重要基础，已成功应用于人机交互、智能医疗以及无人驾驶等领域。本文对视觉问答与推理的相关算法进行了全面概括和归类分析。首先，介绍了视觉问答与推理的定义，并简述了当前该任务面临的挑战；其次，从基于注意力机制、基于图网络、基于预训练、基于外部知识库和基于可解释推理机制5个方面对现有方法进行总结和归纳；然后，全面介绍了视觉问答与推理常用公开数据集，并对相关数据集上的已有算法进行详细分析；最后，对视觉问答与推理任务的未来方向进行了展望。

24 电磁频谱空间态势认知新范式：频谱语义和频谱行为

周博，马欣怡，况婷妍，李婕

2022, 37(6):1198-1207. DOI: 10.16337/j.1004-9037.2022.06.002

[摘要](1254) [HTML](990) [PDF 1.88 M](4259)

摘要:
面对频谱资源日益紧缺、频谱安全日益严峻以及频谱对抗日益激烈的挑战，电磁频谱态势研究急需从感知向认知跃升。本文从多层频谱态势认知体系模型与机理、跨域多维电磁特征提取与融合、频谱语义态势高效补全与预测、频谱行为精准推理与意图识别4个方面出发，综述了频谱态势认知理论与方法的研究现状。面对复杂多域多维电磁频谱环境与多样化任务的挑战，需要构建从“数据到语义”“语义到行为”“单域到跨域”“单层到多层”的频谱态势认知理论技术体系，该体系可为提升天地一体信息网络频谱利用效率、维护空中电波安全有序以及夺取电磁频谱制电磁权/电磁频谱战优势奠定频谱态势理论技术基础。

25 电磁频谱空间射频机器学习及其应用综述

周福辉，张子彤，丁锐，徐铭，袁璐，吴启晖

2022, 37(6):1179-1197. DOI: 10.16337/j.1004-9037.2022.06.001

[摘要](1333) [HTML](524) [PDF 1.24 M](3632)

摘要:
针对电磁频谱空间中频谱资源日益稀缺的问题，新兴的射频机器学习旨在结合电磁频谱领域知识，设计专门的机器学习模型，具有快速、小样本甚至零样本、可解释性和高性能的优势。按照五层网络结构，从物理层、数据链路层、网络层、传输层和应用层出发，本文对已有的射频机器学习在无线通信中具体应用的最新成果进行归类分析。同时，在现有成果基础上，通过对数据驱动和知识驱动的相互作用关系，总结了4种射频机器学习框架（串行/并行/耦合/反馈双驱动框架）。最后，为了促进射频机器学习的研究和实际应用，本文讨论了关键挑战和开放性问题。

26 深度学习在有限视角稀疏采样光声图像重建中的应用

孙正，候英飒

2022, 37(5):971-983. DOI: 10.16337/j.1004-9037.2022.05.001

[摘要](1079) [HTML](662) [PDF 4.04 M](3867)

摘要:
光声成像（Photoacoustic imaging， PAI）是一种多物理场耦合的新型功能成像技术，高质量图像重建是提高成像精度的关键。当探测器采集的光声信号数据不完备时，若采用标准重建方法（如反投影、时间反演和延迟求和等）会导致图像质量以及成像深度的下降。迭代重建算法可在一定程度上解决此问题，但存在计算成本高、需合理选择正则化方法等缺点。近年来，深度学习已经成为医学成像领域的首选方法，其在高效率重建高质量图像方面展现出了巨大潜力。本文对深度学习在有限角度稀疏采样光声图像重建中的应用进展进行总结，对主要方法进行分类归纳，并讨论不同方法的优势和不足。

27 无人机自组网路由协议研究综述

张珉，董超，杨朋，冯斯梦，吴启晖，QUEK Q S T

2022, 37(5):952-970. DOI: 10.16337/j.1004-9037.2022.05.002

[摘要](1823) [HTML](1453) [PDF 1.48 M](3656)

摘要:
随着无人机软硬件技术的发展，多无人机集群自组织形成的无人机自组网（Flying Ad-Hoc networks， FANETs）受到了越来越多的来自学术界和工业界的关注，其灵活的部署和快速的反应能力使其能高效地完成多种多样的任务。而无人机自组网路由协议是提高服务质量（Quality of service， QoS）最重要的方法之一，但无人机自组网的移动性和动态性给路由协议的设计带来了严峻的挑战。传统的移动路由协议不能很好地满足无人机自组网的路由需求，因此研究者们从基于拓扑、地理和分层的角度提出了各式各样的无人机自组网路由协议，旨在克服移动性和提高网络的服务质量，并指出未来无人机自组网的路由协议可以考虑机会路由、软件定义网络（Software defined network，SDN）决策和预测驱动决策等综合提高QoS。本文主要针对无人机自组网网络特征，从不同的路由方法出发，SDN对路由协议进行总结和归纳，并对未来的研究方向进行了展望。

28 可解释的深度TSK模糊系统综述

王士同，谢润山，周尔昊

2022, 37(5):935-951. DOI: 10.16337/j.1004-9037.2022.05.001

[摘要](1509) [HTML](857) [PDF 840.68 K](3656)

摘要:
深度神经网络在多个领域取得了突破性的成功，然而这些深度模型大多高度不透明。而在很多高风险领域，如医疗、金融和交通等，对模型的安全性、无偏性和透明度有着非常高的要求。因此，在实际中如何创建可解释的人工智能（Explainable artificial intelligence， XAI）已经成为了当前的研究热点。作为探索XAI的一个有力途径，模糊人工智能因其语义可解释性受到了越来越多的关注。其中将高可解释的Takagi-Sugeno-Kang（TSK）模糊系统和深度模型相结合，不仅可以避免单个TSK模糊系统遭受规则爆炸的影响，也可以在保持可解释性的前提下取得令人满意的测试泛化性能。本文以基于栈式泛化原理的可解释的深度TSK模糊系统为研究对象，分析其代表模型，总结其实际应用场景，最后剖析其所面临的挑战与机遇。

29 内部威胁发现检测方法研究综述

郭世泽，张磊，潘雨，陶蔚，白玮，郑奇斌，刘艺，潘志松

2022, 37(3):488-501. DOI: 10.16337/j.1004-9037.2022.03.002

[摘要](709) [HTML](1144) [PDF 845.09 K](5146)

摘要:
组织内部网络不仅面临着外部攻击者的威胁，同时也面临以破坏组织网络结构、内部信息资料窃取以及各种诈骗手段为主的内部威胁。内部威胁因为其多元化、伪装性强等特点，对组织机构内部造成了严重影响，因此对于内部威胁发现检测方法的研究变得非常有必要。本文首先对内部威胁进行了描述，重点针对内部威胁发现检测方法的现实意义进行了论述。同时将现有的内部威胁发现检测方法分为3类：基于异常行为的检测方法、基于审计日志异常的检测方法和其他检测方法，分别介绍了现有3类方法的研究现状，并对它们的研究进展进行了总结、归纳和分析。最后对内部威胁发现检测方法的未来研究方向进行了展望。

30 数据科学：从数字世界到数智世界

张清华，高渝，申秋萍

2022, 37(3):471-487. DOI: 10.16337/j.1004-9037.2022.03.001

[摘要](1268) [HTML](833) [PDF 1.63 M](10086)

摘要:
随着大数据的持续发展，数据已经成为国家的重大战略资源，对社会影响日益明显。为了更深入地挖掘和研究大数据背后所蕴藏的基本科学问题，新的研究领域——数据科学被提出。本文从大数据的发展历程出发，介绍了数据科学的兴起和内涵；分析了大数据和数据科学的研究现状，以及数据在各行业中的应用；简述了为探索数据科学本身的内涵和规律而建设的大数据试验场；讨论了数据科学的关键问题，以及在研究数据时应具有的新思维和新观念，以推动数据科学的发展，促进现实世界向数字世界的转型，最终实现社会生活的真正智能化。

31 基于深度学习的计算机视觉研究新进展

卢宏涛，罗沐昆

2022, 37(2):247-278. DOI: 10.16337/j.1004-9037.2022.02.001

[摘要](2978) [HTML](3758) [PDF 12.48 M](5038)

摘要:
近年来，深度学习在计算机视觉各个领域中的应用成效显著，新的深度学习方法和深度神经网络模型不断涌现，算法性能被不断刷新。本文着眼于2016年以来的一些典型网络和模型，对基于深度学习的计算机视觉研究新进展进行综述。首先总结了针对图像分类的主流深度神经网络模型，包括标准模型及轻量化模型等；然后总结了针对不同计算机视觉领域的主流方法和模型，包括目标检测、图像分割和图像超分辨率等；最后总结了深度神经网络搜索方法。

32 基于瞬态图像的非视距成像技术综述

梁云，宋柏延

2022, 37(1):21-34. DOI: 10.16337/j.1004-9037.2022.01.002

[摘要](898) [HTML](1916) [PDF 3.26 M](2958)

摘要:
瞬态图像是一种场景对光脉冲进行响应的快速图像序列。通过对时间维度信息的捕获，瞬态图像实现了对时域中蕴藏的场景信息的有效利用，而非视距成像是瞬态图像在场景解析领域中最典型的应用。非视距成像是一种对视线范围外物体或场景进行成像的技术，近几年在国内外广受关注。本文根据不同的成像机理，对瞬态图像的不同成像方式进行分类，并根据算法原理或实现效果的不同，对比了多种基于瞬态图像的非视距成像算法。最后总结了基于瞬态图像的非视距成像技术面临的挑战，并展望了未来的发展方向。

33 雷达有源干扰识别算法综述

周红平，王子伟，郭忠义

2022, 37(1):1-20. DOI: 10.16337/j.1004-9037.2022.01.001

[摘要](1785) [HTML](2211) [PDF 1.18 M](4986)

摘要:
在当代电子战中，电子干扰与抗干扰的较量愈演愈烈。开展针对雷达有源干扰的识别算法已经成为雷达对抗领域研究的热点，具有重大的战略意义。本文针对雷达有源干扰识别算法进行整体分析，总结了目前国内外干扰识别手段的一般流程。首先对常见雷达干扰的种类进行划分，详细介绍目前常见的雷达有源干扰信号的干扰机理和信号模型，然后从特征提取手段和分类器的设计两个角度出发全面地梳理干扰识别算法流程。最后针对雷达有源干扰识别算法未来的发展方向做出了展望。