2017, 32(3):431-439. DOI: 10.16337/j.1004-9037.2017.03.001
摘要:由于丰富的频谱资源,毫米波通信已成为未来无线网络的重要研究方向。毫米波通信在短距离无线接入虽已取得明显进展,但如何实现超高速广域覆盖还存在巨大的挑战。本文回顾分析了毫米波信道模型、毫米波多天线传输和毫米波通信网络构架等关键技术的国内外研究现状和发展趋势,提出将毫米波无线通信与新兴的大规模多天线和大规模协作无线传输技术紧密结合,并引入云计算和分布式存储处理等新方法,形成密集分布毫米波大规模多天线无线通信新型网络构架,解决毫米波移动通信的广域大容量无线覆盖和支持终端中高速移动等关键性技术的瓶颈。
2017, 32(3):440-453. DOI: 10.16337/j.1004-9037.2017.03.002
摘要:空间调制(Spatial modulation,SM )技术借助于天线序号“隐形”地传输信息,能够获得高数据传输速率,而且可有效克服信道间的干扰和同步问题,降低系统的实现复杂度。多输入多输出(Multiple input multiple output,MIMO)技术,能够极大地提高无线通信系统的容量和频谱效率。为了满足无线通信系统高质量和高速率的要求,将SM和MIMO技术有效结合,SM-MIMO技术应运而生,成 为近年来无线通信领域研究的热点方向。本文从基本原理和性能分析两方面介绍了SM-MIMO技 术及其研究现状,并且探讨了SM-MIMO技术的应用前景。同时也对近年来国内外研究团队在SM-MIMO方面的研究成果进行了综述和概括,最后对该领域的未来研究工作进行了分析和展望。
2017, 32(3):454-462. DOI: 10.16337/j.1004-9037.2017.03.003
摘要:毫米波频段拥有大量未充分使用的频谱资源,能有效缓解低频段频谱拥塞,并且由于毫米波波长较短,能极大地减小大规模天线系统的物理尺寸,使得毫米波通信成为5 G无线通信系统潜在的关键技术之一。考虑到毫米波传播路径损耗严重,毫米波系统需采用波束成形技术改善传输质量。在毫米波大规模多输入多输出(Multiple-input multiple-out, MIMO)系统中,由于数字波束成形高功耗、高成本问题,混合数模波束成形成为重要的替代方案。本文首先阐述了毫米波混合波束成形的研究现状,而后给出了系统模型,最后介绍了信道估计、码本设计和低复杂度设计等混合波束成形的关键技术。
2017, 32(3):463-468. DOI: 10.16337/j.1004-9037.2017.03.004
摘要:基于信道极化 定理而提出的极化码是目前唯一被严格理论证明可以达到香农容量限的编码,并被接受为第五代移动通信系统(5G)中短码控制信道的编码方案。本文首先给出极化码的编码和译码原理,然后提出一种极化码与奇偶校验码级联的设计方案,发送端编码器采用奇偶校验码作为外码,极化码作为内码的级联编码结构。接收端译码器采用基于奇偶校验辅助的连续消 除列表译码算法。相比于极化码与循环冗余校验码的级联方案,本文提出的级联设计方案具有更加优良的纠错性能,且没有提升编、译码的复杂度,有能力满足5G移动通信控制信道对纠错性能的要求。
2017, 32(3):469-478. DOI: 10.16337/j.1004-9037.2017.03.005
摘要:随着计算机、电视机和手机等显示设备分辨率的迅速增加,采用显示流压缩(Display stream compression,DSC)技术解决显示链路带宽不足已成业界的共识。近年来陆续出现了JEPG-XS,H.264/AVC和Dirac(VC-2)的纯帧内编码、HEVC-SCC屏幕内容编码和VESA的DSC等显示链路压缩技术。其中最为典型的是视频电子标准协会(Video electronics standands association, VESA)的 DSC标准,这是一个被广泛接受的用于显示链路的低成本、短延时和视觉无损的轻量级编解码标准。DSC的高效编码技术包括先进的预测、历史彩色索引、简捷的熵编码以及良好的速率控制等。本文综述了DSC标准的新特性和主要技术概况。
2017, 32(3):479-488. DOI: 10.16337/j.1004-9037.2017.03.006
摘要:随着网络的快速发展,网络安全成为计算机网络中一个重要的研究方向。网络攻击日益频繁,传统的安全防护产品存在漏洞, 入侵检测作为信息安全的重要防护手段弥补了防火墙的不足,提供了有效的网络入侵检测措施,保护网络安全。然而传统的入侵检测系统存在许多问题,基于机器学习的入侵检测方法实现了对网络攻击的智能检测,提高了入侵检测的效率,降低了漏报率和误报率。本文首先简要介绍机器学习的部分算法,然后对机器学习算法在网络入侵检测中的应用进行深入的分析,比较各个算法在入侵检测应用中的优势和缺点,最后总结了机器学习的应用前景,为获得性能良好的网络入侵检测和防御系统奠定基础。
2017, 32(3):489-496. DOI: 10.16337/j.1004-9037.2017.03.007
摘要:针对现有词包模型对目标识别性能的不足,对特征提取、图像表示等方面进行改进以提高目标识别的准确率。首先,以密集提取关键点的方式取代SIFT关键点提取,减少了计算时间并最大程度地描述了图像底层信息。然后采用尺度不变特征变换(Scale-invariant feature transform, SIFT)描述符和统一模式的局部二值模式(Local binary pattern,LBP)描述符描述关键点周围的形状特征和纹理特征,引入K-Means聚类算法分别生成视觉词典,然后将局部描述符进行近似局部约束线性编码,并进行最大值特征汇聚。分别采用空间金字塔匹配生成具有空间信息的直方图,最后将金字塔直方图相串联,形成特征的图像级融合,并送入SVM进行分类识别。在公共数据库中进行实验,实验结果表明,本文所提方法能取得较高的目标识别准确率。
2017, 32(3):497-506. DOI: 10.16337/j.1004-9037.2017.03.008
摘要:针对多用户多输入多输出(Multi-user multiple-input multiple-output, MU-MIMO)系统中,每用户酉速率控制(Per-user unitary and rate control,PU2RC)算法在低用户数及高信噪比情况下性能不够理想的问题,提出一种基站端精确重构信道信息并选取服务用户集的下行自适应发送方案。基站端先利用用户反馈的信道矢量范数及信道方向信息(Channel direction information,CDI)重构下行信道矢量,再采取相似码本矢量共享用户的方法扩大各码本矩阵的关联用户集合,最后以和速率最大为目标选择最优的服务用户集。该方案提高了低用户数情况下出现多用户模式的概率,在用户间干扰与服务用户数之间实现了折衷,相较于PU2RC和已有的改进PU2RC方案,获得了更优的和速率性能。
2017, 32(3):507-515. DOI: 10.16337/j.1004-9037.2017.03.009
摘要:传统的主曲线算法在小规模数据集上能获得良好的效果,但单节点的计算和存储能力都不能满足海量数据主曲线的提取要求,而算法分布式并行化是目前解决该类问题最有效的途径之一。本文提出基于MapReduce框架的分布式软K段主曲线算法 (Distributed soft k-segments principal curve,DisSKPC)。首先,基于分布式K-Means算法,采用递归粒化方法对数据集进行粒化,以确定粒的大小并保证粒中数据的关联性。然后调用软K段主曲线算法计算每个粒数据的局部主成分线段,并提出用噪声方差来消除在高密集、高曲率的数据区域可能产生的过拟合线段。最后借助哈密顿路径和贪婪算法连接这些局部主成分线段,形成一条通过数据云中间的最佳曲线。实验结果表明,本文所提出的DisSKPC算法具有良好的可行性和扩展性。
2017, 32(3):516-522. DOI: 10.16337/j.1004-9037.2017.03.010
摘要:传统的文本分类方法假设训练集与测试集中的特 征词服从相同的概率分布,但在实际应用中,以上假设存在偏差,会影响到最终的分类结果。针对这一情况,本文采用迁移学习,通过计算特征词的迁移量对训练集中向量空间模型进行修正,最终使训练集与测试集中特征词的分布概率趋于一致。将提出的方法应用于中文垃圾邮件过滤与中、英文网页分类中,在CHI统计特征选择基础上进行特征迁移,实验结果表明新方法可以有效消除特征词分布的差异性,使文本分类的各项指标明显提高。
2017, 32(3):523-532. DOI: 10.16337/j.1004-9037.2017.03.011
摘要:时间线摘要是在时间维度上对文本进行内容归纳和概要生成的技术。传统的时间线摘要主要研究诸如新闻之类的长文本,而本文研究微博短文本的时间线摘要问题。由于微博短文本内容特征有限,无法仅依靠文本内容生成摘要,本文采用内容覆盖性、时间分布性和传播影响力3种指标评价时间线摘要,并提出了基于滑动窗口的微博时间线摘要算法(Microblog timeline summariaztion based on sliding window, MTSW)。该算法首先利用词项强度和熵来确定代表性词项;然后基于上述3种指标构建出评价时间线摘要的综合评价指标;最后采用滑动窗口的方法,遍历时间轴上的微博消息序列,生成微博时间线摘要。利用真实微博数据集的实验结果表明,MTSW算法生成的时间线摘要可以有效地反映热点事件发展演化的过程。
2017, 32(3):533-539. DOI: 10.16337/j.1004-9037.2017.03.012
摘要:针对传统基于可穿戴传感设备步态周期检测方法需要用户高度配合的问题,本文采用计算机视觉的方法来研究高精度步态周期检测算法。受帧差法的启示,本文设计一种全新的步态图像表达特征帧差步态时空特征,该特征不仅蕴含了步态 运动的空间,还含有步态运动的时间信息,能较好地表达步态运动周期中的各个状态。基于帧差步态时空特征,设计足趾离地状态检测算法,进而实现步态周期的自动检测。实验结果表明,本方法能精确检测步态周期中的足趾离地状态帧。
2017, 32(3):540-549. DOI: 10.16337/j.1004-9037.2017.03.013
摘要:基于到达时间差(Time difference of arrival, TDOA)估计的方法是声源波达方向(Direction of arrival, DOA)估计中的一类重要方法。其中由TDOA到DOA的映射是该类方法的关键步骤。本文提出了一种基于多核聚类最小二乘支持向量回归(Least-squares support vector regression, LS-SVR)的TDOA-DOA映射方法,并且分析了其稀疏化处理后的性能。为了提高混响噪声环境下的TDOA-DOA映射性能,本文还给出了一种基于归一化中值滤波的TDOA估计离群值消除方法。仿真结果表明,本文提出的方法要优于现有的最小二乘方法以及单核LS-SVR方法。
2017, 32(3):550-558. DOI: 10.16337/j.1004-9037.2017.03.014
摘要:文本表示作为文本分类的一个基本问题,一直广受关注。目前文本表示主要有词袋模型、隐式语义表达和基于知识库的显式语义表达3种方式。本文首先分析对比了这3种文本表示方式在文本分类中的效果。实验发现,基于知识库的显式语义表达并没有如预期一样提高文本分类的效果。经分析,其原因在于显式语义表达在扩展文档表达时易引入噪声。针对该问题,本文提出了一种有监督的显式语义表达方法。该方法利用数据集的标注信息识别文档中与分类最相关的核心概念,并扩展核心概念以形成文档显式语义表达。3个标准分类数据集上的结果证实了本文所提文本表示方法的有效性。
2017, 32(3):559-569. DOI: 10.16337/j.1004-9037.2017.03.015
摘要:现有的全局流形学习算法都敏感于邻域大小这一难以高效选取的参数,它们都采用了基于欧氏距离的邻域图创建方法,从而使邻域图容易产生“短路”边。本文提出了一种基于随机游走模型的全局 流形学习算法(Random walk-based isometric mapping,RW-ISOMAP)。和欧氏距离相比,由随机游走模型得到的通勤时间距离是由给定两点间的所有通路以概率为权组合而成的,不但鲁棒性更高,而且还能在一定程度上度量具有非线性几何结构的数据之间的相似性。因此采用通勤时间距离来创建邻域图的RW-ISOMAP算法将不再敏感于邻域大小参数,从而可以更容易地选取邻域大小参数,同时还具有更高的鲁棒性。最后的实验结果证实了该算法的有效性。
2017, 32(3):570-578. DOI: 10.16337/j.1004-9037.2017.03.016
摘要:针对传统的边缘检测算法抗噪能力弱、弱小边缘难以检测以及边缘图像容易出现断层等问题,本文提出了一种新的边缘检测算法。该方法首先对边缘进行提取,然后进行边缘连接。边缘是图像灰度突变的反应,像素点的梯度以该像素点为对称中心,由对称位置灰度有明显变化的像素点的个数加权得到。对梯度较大的像素点计算其方向,通过像素点方向的连续性进行边缘提取。为了克服边缘图像出现断层的缺陷,利用蚁群算法进行边缘连接 。实验结果表明,该方法有较强的抗噪能力,尤其对椒盐噪声,且可以有效地检测出灰度变 化不明显的边缘。
2017, 32(3):579-587. DOI: 10.16337/j.1004-9037.2017.03.017
摘要:情感分析已经成为当今自然语言处理领域的热点问题。对于文本的自动化、半监督式的情感分析研究具有广泛的理论和实用价值。基于情感词典的情感倾向分析方法是文本情感分析的一种重要 手段。然而,中文词汇在不同领域中的情感倾向不尽相同,一词多义现象明显。同时,不同领域中的情感词也具有专业性、领 域性的特点。针对这些问题,本文提出一种基于词向量相似度的半监督情感极性判断算法 (Sentiment orientation from word vector,SO-WV),并依据该算法设计出一种跨领域的中文情感词典构建方法。实验证明,本文所设计的情感词典构建方法能有效地对情感词情感倾向进行判断。算法不仅在不同领域的情感词典 建立上具有良好的可移植性,同时还具有专业性、领域性的特点。
2017, 32(3):588-594. DOI: 10.16337/j.1004-9037.2017.03.018
摘要:在Quinn算法和插值迭代算法(A&M算法)的基础上 ,提出了一种改进的离散傅里叶变换(Discrete Fourier transform, DFT)插值频率估计算法。该算法首先通过Quinn算法估计出1个频率误差作为迭代估计算法的误差初值,然后用迭代算法精确估计频率误差。改进后的算法可以有效减少迭代次数,因此同时具有Quinn算法 的高效率和A&M插值迭代算法的高精度。为了提高算法在DSP处理器上的运行效率,本文还对算法在DSP上的实现提出了一种优化方法,有利于该算法的实时性应用。仿真结果表明该算法在频率估计精度、实时运算效率以及对噪声的抗干扰性能上均获得了提升。
2017, 32(3):595-603. DOI: 10.16337/j.1004-9037.2017.03.019
摘要:基于图像的二维人脸识别技术日趋成熟,但仍受光照、姿态和表情等变化的影响。利用三维人脸模型提高人脸识别性能并将其应用于实际成为近几年学术界的研究趋势。本文提出了SWJTU-MF多模人脸数据库(SWJTU multimodal face database, SWJTU-MF Database),包 含200个中性表情中国人的4种人脸样本数据,包括可见光图像、二维视频序列、三维人脸(高精度)和立体视频序列。本文首先分类介绍现有的三维人脸识别算法,然后概述相关的多模人脸数据库,接着提出SWJTU-MF多模人脸数据库,并说明数据库的采集装置、采集环境、采集过程及数据内容,随后简要展示数据标准化过程。最后讨论本数据库面向的应用研究,并给出SWJTU-MF建议的评测协议。
2017, 32(3):604-611. DOI: 10.16337/j.1004-9037.2017.03.020
摘要:实体链接任务主要包括命名实体识别、查询扩展、候选实体选择、特征抽取和排序。本文针对查询词的扩展,提出了一种基于词向量的扩展方法。该方法利用连续词袋(Continuous bag-of-words,CBOW)模型训练语料中词语的词向量,然后将距离查询词近的词作为扩展词。词向量从语料中挖掘出词与词之间的语义相关性是对基于规则的查询扩展方法的补充,以此来召回候选实体。在特征抽取时,把文档之间的潜在狄利克雷分布(Latent Dirichlet allocation, LDA)的主题相似性作为特征之一。在计算文档相似性时,不再以高频词作为向量的维度,而是以基于词向量的相关词作为向量维度,由此得到文档的语义相似性特征 。最后利用基于单文档方法的排序学习模型把查询词链接到相应的候选实体。实验结果表明利用该方法能使F1值达到0.71,具有较好的效果。
2017, 32(3):612-620. DOI: 10.16337/j.1004-9037.2017.03.021
摘要:传统的静态特征码检测方法无法识别迷惑型恶意代码,而动态检测方法则需要消 耗大量资源;当前,大多数基于机器学习的方法并不能有效区分木马、蠕虫等恶意软件的子类别。为此,提出一种基于代码恶意行为特征的分类方法。新方法在提取代码恶意导向指令特征的基础上,学习每种代码类别特有的恶意行为序列模式,进而将代码样本投影到由恶意行为序列模式构成的新空间中。同时基于新特征表示法构造了一种近邻分类器对恶意代码进行 分类。实验结果表明,新方法可以有效地捕捉代码的恶意行为并区分不同类别代码之间的行为差异,从而大幅提高了恶意代码的分类精度。
2017, 32(3):621-628. DOI: 10.16337/j.1004-9037.2017.03.022
摘要:为了使图像边缘检测算法的抗噪声能力更强,能检测到更加丰富的边缘信息,在多尺度形态学边缘检测算法的基础上,提出一种抗噪的多尺度形态学边缘检测算法。一方面,用小波变换法替代常用的加权平均法来融合各尺度下获取的边缘图像,对小波分解后得到的低频系数和高频系数分别采取不同的融合策略,从而有效地保留边缘的细节信息,使得融合后获得的图像清晰且细节丰富。另一方面,在用不同尺度的结构元素检测图像边缘时都采用抗噪的检测算法,因此,该算法具有较强的抗噪声能力。仿真结果表明,该算法既能有效地降低噪声对检测结果的影响,又能获得较理想的边缘图像。
2017, 32(3):629-635. DOI: 10.16337/j.1004-9037.2017.03.023
摘要:针对互联网出现的评论文本情感分析,引入潜在狄利克雷分布(Latent Dirichlet allocation,LDA)模型,提出一种分类方法。该分类方法结合情感词典,依据指定的情感单元搭配模式,提取情感信息,包括情感词和上、下文。使用主题模型发掘情感信息中的关键特征,并融入到情感向量空间中。最后利用机器学习分类算法,实现中文评论文本的情感分类。实验结果表明,提出的方法有效降低了特征向量的维度,并且在文本情感分类上有很好的效果。
2017, 32(3):636-642. DOI: 10.16337/j.1004-9037.2017.03.024
摘要:通过对越南语词法特点的研究,把越南语的基本特征融入到条件随机场中(Condition random fields,CRFs),提出了一种基于CRFs和歧义模型的越南语分词方法。通过机器标注、人工校对的方式获取了25 981条越南语分词语料作为CRFs的训练语料。越南语中交叉歧义广泛分布在句子中,为了克服交叉歧义的影响,通过词典的正向和逆向匹配算法从训练语料中抽取了5 377条歧义片段,并通过最大熵模型训练得到一个歧义模型,并融入到分词模型中。把训练语料均分为10份做交叉验证实验,分词准确率达到了96.55%。与已有越南语分词工具VnTokenizer比较,实验结果表明该方法提高了越南语分词的准确率、召回率和F值。
2017, 32(3):643-648. DOI: 10.16337/j.1004-9037.2017.03.025
摘要:基于小容量数据集的手势识别是人机交互技术研究中的一个重要课题。本文提出了一种基于线性判别分析和自适应K近邻法的手势识别方法。首先,应用高斯背景建模方法从包含目 标交互者的训练视频集中提取各类手型图像,并调整到相同尺度来构建手势训练集。然后,通过改进的线性判别分析对训练数据进行特征提取。最后提出一种自适应K近邻法对实时交互过程中得到的手型信息进行分类和识别。应用上述方法自建小型手势库进行实验和比较分析,结果显示与现有的手势识别算法相比,本文方法具有更高的识别率。
您是本站第 访问者
通信地址:南京市御道街29号 南京航空航天大学(明故宫校区)
邮编:210016 传真:025-84892742
电话:025-84892742 E-mail:sjcj@nuaa.edu.cn
技术支持:北京勤云科技发展有限公司
网站版权: © 《数据采集与处理》 编辑部