2017, 32(1):1-16. DOI: 10.16337/j.1004-9037.2017.01.001
摘要:人体运动捕获数据作为一种新型的多媒体数据,因其高度的逼真性,已经在多个领域得到了广泛的应用。但运动捕获设备的高昂价格导致运动捕获数据使用的成本过高,所以运动重用技术就成为解决这一问题的有效手段。可是运动捕获数据复杂的结构和特性给运动重用带来了很大的挑战,尽管已经过多年的研究,但仍然有很多尚未解决的问题,需要研究人员更多的关注和研究投入。本文针对运动重用过程中各个环节的重要技术,从研究的意义、问题的难点、现有方法思路及使用的模型等多个角度进行了介绍,并针对一些具有代表性的方法做了较为详细的描述。最后总结了现有运动捕获数据重用技术的研究进展,展望了未来的发展趋势。本文旨在引起人们对该领域的深入思考,并为以后的研究提供有价值的参考。
2017, 32(1):17-25. DOI: 10.16337/j.1004-9037.2017.01.002
摘要:随机优化方法是求解大规模机器学习问题的主流方法,其研究的焦点问题是算法是否达到最优收敛速率与能否保证学习问题的结构。目前,正则化损失函数问题已得到了众多形式的随机优化算法,但绝大多数只是对迭代进行 平均的输出方式讨论了收敛速率,甚至无法保证最为典型的稀疏结构。与之不同的是,个体解能很好保持稀疏性,其最优收敛速率已经作为open问题被广泛探索。另外,随机优化普遍采用的梯度无偏假设往往不成立,加速方法收敛界中的偏差在有偏情形下会随迭代累积,从而无法应用。本文对一阶随机梯度方法的研究现状及存在的问题进行综述,其中包括个体收敛速率、梯度有偏情形以及非凸优化问题,并在此基础上指出了一些值得研究的问题。
2017, 32(1):26-36. DOI: 10.16337/j.1004-9037.2017.01.003
摘要:句子的语义处理是自然语言处理的重要难题与挑战。抽象语义表示(Abstract meaning representation, AMR)是近几年国际上新兴的句子级语义表示方法,突破了传统的句法树结构的限制,将一个句子语义抽象为一个单根有向无环图,很好地解决了论元共享问题,成为语言资源建设和句子语义解析的研究热点。本文从AMR概念与规范、解析算法和应用等方面对AMR相关研究进行系统的梳理,特别对AMR的各种解析算法进行了比较深入的分析和比较,指出了现有算法存在的问题和不足,同时介绍了中文AMR的开发进展,最后展望了AMR未来的研究方向。
2017, 32(1):37-45. DOI: 10.16337/j.1004-9037.2017.01.004
摘要:提出了一种模拟高斯信源通过多中继网络进行压缩转发的系统模型,该系统模型可以描述实际中传感器受限于环境或成本,只能进行简单的模拟信号发送,而中继器能够进行复杂的分布式信源编码和信道编码的传感中继网络。本文提出了该系统的理论分析框架,对传感器网络的分布式信源编码问题,采用CEO理论建立多中继网络的率失真函数,结合Shannon信道容量理论,将传感器网络与数字通信网络建立联系。本文提出了系统的优化设计理论方法,在总功率受限条件下,在传感器网络和通信网络之间进行功率分配,使信噪比性能达到最大。理论分析和仿真结果表明,本文提出的方法比模拟中继转发系统在低信噪比区域抗干扰性能更好。在高信噪比区域,随着总信噪比约束的增大,可提高至10 dB以上。
2017, 32(1):46-53. DOI: 10.16337/j.1004-9037.2017.01.005
摘要:区间型数据(Interval data, ID)是属性特征取值为区间的一类数据,针对区间型数据的分类问题,本文提出一种高斯区间核支持向量机分类模型(Support vector machine based on Gauss interval kernel, GIK_SVM)。该方法引入半宽因子,在区间型数据的中值与半宽度之间进行折中,并据此构造高斯区间核用以衡量两个区间型数据间的相似性,然后用SVM模型进行分类。在人造数据集和真实数据集上的实验结果表明,本文提出的算法对区间数据有更好的分类性能。
2017, 32(1):54-61. DOI: 10.16337/j.1004-9037.2017.01.006
摘要:说话人聚类是说话人分离中的一个重要过程,然而传统的以贝叶斯信息准则作为距离测度的层次聚类方式,会出现聚类误差向上传递的情况。本文提出了一种逐级算法增强处理机制。当片段之间的最小贝叶斯信息准则距离超过设定的门限值时,或者类别个数到达一定程度时,将当前聚类结果作为初始类中心,通过变分贝叶斯迭代法重新对每个类别中的片段调优,最后再依据概率线性判别分析得分门限确定说话人个数。实验表明,本文方法在美国国家标准技术署08 summed测试集上,使得“类纯度”和“说话人纯度”比传统算法都有了一定提升,且使得说话人分离整体性能相对提升了27.6%。
2017, 32(1):62-70. DOI: 10.16337/j.1004-9037.2017.01.007
摘要:针对指纹图像的纹理特征,深入分析了指纹图像 的纹理结构及与二维正弦曲面模式的相似性,构造设计了二维正弦曲面滤波器。为了降低边际噪声对滤波器性能的影响,提升滤波器的滤波增强效果,采用二维高斯函数对二维正弦曲面滤波器进行调制,最终构建了高斯调制二维正弦曲面滤波器,设计实现了基于该滤波器的指纹增强算法。分组实验结果表明,文中提出的基于高斯调制二维正弦曲面滤波器的指纹增强 算法能够有效地提高指纹图像的质量,对普遍存在于低质量指纹图像中的断线、疤痕和粘连等强噪声区域的增强效果更好。
2017, 32(1):71-77. DOI: 10.16337/j.1004-9037.2017.01.008
摘要:针对H.264中UMHexagonS算法存在的不足,提出了一种改进的快速运动估计算法。改进算法根据起始预测运动矢量成为最佳点的可能性大小对起始预测运动矢量的检测顺序进行了优化,提高了编码效率;设计了一种改进的5×5螺旋全搜索模板,减少了5×5螺旋全搜索模板的搜索点数;增加了一种针对亚宏块的提前终止策略,进一步减少了运动估计带来的运算量。实验结果表明,改进算法在基本保持UMHexagonS算法编码性能的同时,有效减少了运动估计时间,提高了编码效率,并且可适用于不同运动强度的视频序列。
2017, 32(1):78-85. DOI: 10.16337/j.1004-9037.2017.01.009
摘要:针对高斯混合假设概率密度滤波扩展目标跟踪算法中的观测集合划分问题,本文分析了距离门限划分方法存在的问题,提出了一种利用聚类方法进行观测数据集合划分的方法。该方法利用极大似然方法获得目标数的估计值,以此作为聚类数利用K-means聚类对观测数据集合进行聚类划分,并利用椭球门限对观测数据进行处理以降低杂波观测对聚类划分的影响。实验结果表明,该方法能够获得正确的划分观测集合,计算复杂度较距离门限划分方法有较大降低,同时在多目标跟踪效果方面优于观测数据距离门限划分的假设概率密度滤波扩展目标跟踪算法。
2017, 32(1):86-94. DOI: 10.16337/j.1004-9037.2017.01.010
摘要:研究在用户服务质量需求和功率约束等条件下最大化系统能效的多小区多用户系统中的波束赋形技术。首先引入辅助变量将分式形式的非凸优化目标函数转化为凹凸分数形式的优化目标函数,并利用分式规划和低复杂度凸逼近法进行功率分配优化;然后将波束优化问题转化成满足一定约束条件的最小化发射功率优化问题,并利用二阶锥规划求解相应的波束赋形优化问题。仿真结果表明:所提的能效分层优化算法可以经过有限迭代次数逐渐收敛到稳定值;在低发射功率区域,所提算法能够同时获得最大频谱效率和能源效率;而在高发射功率区域,本文算法所获得的能效性能明显优于传统的频谱效率最大化算法。
2017, 32(1):95-103. DOI: 10.16337/j.1004-9037.2017.01.011
摘要:梯级水火电力系统的复杂性导致其调度优化问题难以使用经典的优化方法进行解决。本文通过变权重因子改进差分进化算法,提出新的方法解决其调度优化问题。采用启发式策略解决优化问题中的平衡约束。为了充分发挥能耗较低的火力发电机作用,设计基于优先列表的启发式策略,解决动态电力平衡约束。在满足平衡约束条件的过程中,部分个体的取值被改变,增加了群体的 多样性,拓展了算法的搜索空间,进而得到更优的调度解决方案。仿真结果表明,本文提出的方案有效地解决了梯级水火电力系统的调度优化。
2017, 32(1):104-110. DOI: 10.16337/j.1004-9037.2017.01.012
摘要:图像特征匹配是基于内容的图像检索(Contentbased image retrieval,CBIR) 实现的一个关键环节,而图像特征的匹配主要依赖于图像特征之间的相似度测量。为了提高CBIR的检索性能,本文提出了一种有效的相似度测量方法——基于图像k近邻的相似度测量(Similarity measure based on k-nearest neighbors of images, SBkNN)方法。在该方法中,查询图像与被检索图像的相似度通过计算这两幅图像属于同一语义(无论是哪种语义)种类的联合概率来衡量,而此概率可分别通过分析这两幅图像与各自近邻图像的距离得到。最后利用Corel5k数据集对本文所提出的SBkNN方法和传统的相似度测量方法进行了对比。实验结果表明,在CBIR中使用本文提出的SBkNN方法,有效地提高了CBIR的检索性能。
2017, 32(1):111-118. DOI: 10.16337/j.1004-9037.2017.01.013
摘要:模式识别的技术核心就是特征提取,而特征融合则是对特征提取方法的强力补充,对于提高特征的识别效率具有重要作用。本文基于稀疏表示方法,将稀疏表示方法用到高维度空间,并利用核方法在高维度空间进行稀疏表示,用其计算核稀疏表示系数,同时研究了核稀疏保持投影算法(Kernel sparsity preserve projection,KSPP)。将KSPP引入到典型相关分析算法(Canonical correlation analysis,CCA),研究了基于核稀疏保持投影的典 型相关分析算法(Kernel sparsity preserve canonical correlation analysis,K-SPCCA)。在多特征手写体数据库和人脸图像数据库上分别证实了本文提出方法的可靠性和有效性 。
2017, 32(1):119-125. DOI: 10.16337/j.1004-9037.2017.01.014
摘要:由于印章覆盖、发票折痕等干扰因素的存在,一些发票号码区域会出现噪声粘连区域,这些区域会导致发票号码无法正常分割。 针对这一问题,提出了噪声粘连区域修复算法,有效地避免了该情况对数字分割的影响。针对普通发票号码的字体结构和特点,提出了基于数字结构特征的发票号码识别算法。首先定义数字结构特征,包括4种填充区域、2种字符穿越数和4种镂空区域,构成待识别数字的10维特征向量;进而与标准模板库中数字进行模板特征匹配,求得距离最小值所对应的数字作为识别结果。将所提出的方法和基于改进的左右轮廓特征的印刷体数字识别方法进行对比,实验结果表明,本文所提出的识别算法拥有更高的准确率和更快的识别速度,以及对噪声 有更强的鲁棒性。
2017, 32(1):126-133. DOI: 10.16337/j.1004-9037.2017.01.015
摘要:探测社团结构是复杂网络分析中一个基本和重要的问题。为提高探测社团结构的效率,本文提出了基于复杂网络场论的社团结构分布估计算法。通过设置不同种群规模,本文算法运用经典物理场论理论构建节点间场论模型,并在此基础上建立了社团结构概率模型,按照社团结构概率模型建立了分布估计算法。将该算法与GN(Girvan Newman)算法、遗传算法及启发式算法比较其产生的最优解,并分析它们的均值及方差的差异,结果表明:基于复杂网络场论的社团结构分布估计算法收敛速度较快,划分效果较好。
2017, 32(1):134-140. DOI: 10.16337/j.1004-9037.2017.01.016
摘要:为了降低干扰对齐所需的处理开销,将链路划分为多个簇分别进行处理成为可行的办法之一。针对现有簇划分算 法中运算复杂度较高的问题,本文提出了一种基于最小信干比的簇划分算法。在此基础上,针对所有簇同时通信造成部分簇内链路接收端信干噪比(Signal to interference plus noise ratio,SINR)较低的问题,本文将以链路为单位的调度问题等效为以簇为单位的调度问题,提出了一种基于层次聚类的簇调度算法。理论与仿真实验结果表明,本文所提出的簇划分算法的运算复杂度明显低于现有算法,且相同条件下的系统平均吞吐量更高。同时,本文提出的基于簇层次聚类的调度算法不同程度地提升了各簇内链路接收端的SINR,系统可根据不同的性能需求进行调度策略选择。
2017, 32(1):141-148. DOI: 10.16337/j.1004-9037.2017.01.017
摘要:多词表达的识别错误会对很多自然语言处理任务造成不利影响。DE-Tri-Training半指导聚类算法在聚类初期使用有指导的标注信息,取得了较好的抽取结果。本文采用基于中心词扩展的初始聚类中心确定方法和基于有指导信息的一致性协同学习数据净化方法,提出了半指导策略抽取汉语多词表达,聚类算法的中后期也加入有指导的信息,使分类器能使用正确的标注信息进行训练。通过与DE-Tri-Training算法的对比实验,改进的DE-Tri-Training算法得到的汉语多词表达抽取结果优于原来的算法,验证了改进DE-Tri-Training算法的有效性。
2017, 32(1):149-156. DOI: 10.16337/j.1004-9037.2017.01.018
摘要:指代消解是一种为了确定文章中出现的指代词与前文中出现的内容是否为同一事物的技术,在海量信息文本智能处理中具有重要的作用,而人称代词在各种指代词集合中占有相当一部分比例。本文采用规则与语义相结合的方法对中文人称代词进行指代消解,在基础的语法过滤规则之上新增同位语规则过滤指代词的候选消解项;提出更精确的同义词距离计算方法,利用同义词词林和知网对人称代词的关联词与候选先行词的关联词进行语义关系计算,选择关联度最高的候选先行词作为最终的指代结果。通 过不同方法的对比实验和在真实语料数据集上的实验表明,本文所提方法获得了较好的效果。
2017, 32(1):157-165. DOI: 10.16337/j.1004-9037.2017.01.019
摘要:提出一种双向增强扩散滤波的图像去噪模型。简化扩散方程建立双向扩散系数,使模型在扩散过程中能够实现平滑与锐化的双向过程,为加强平滑和锐化强度,用小波变换增强图像,使整体图像轮廓得到增强和局部图像纹理特征得到弱化。然后,对阈值进行了自适应设计和改进,使其根据图像的最大灰度值和迭代次数自动控制阈值,进一步保留图像边缘和细节特征。实验仿真和可行性的验证结果表明,新模型去噪效果较理想,不但能抑制噪声,而且能保护细节信息,峰值信噪比得到了有效的提高,性能更优越。
2017, 32(1):166-174. DOI: 10.16337/j.1004-9037.2017.01.020
摘要:基于已有软件缺陷数据,建立分类模型对待测软件模块进行预测,能够提高测试效率和降低测试成本。现有基于机器学习方法对软件缺陷预测的研究大部分基于二支决策方式,存在误分率较高等问题。本文针对软件缺陷数据具有代价敏感特性且软件度量取值为连续值等特性,提出了一种基于邻域三支决策粗糙集模型的软件缺陷预测方法,该方法对易分错的待测软件模块作出延迟决策,和二支决策方法相比,降低了误分类率。在NASA软件数据集上的实验表明所提方法能够提高分类正确率并减小误分类代价。
2017, 32(1):175-181. DOI: 10.16337/j.1004-9037.2017.01.021
摘要:稀疏数据严重影响句子结构分析模型的结果, 而句法结构是语义内容和句法分析形式的结合。本文在语义结构信息标注的基础上提出了一种基于语义搭配关系的词聚类模型和算法,建立基于语义类的头驱动句子结构分析统计模型。该语言模型不但比较成功地解决了数据稀疏问题, 而且句子结构分析系统性能也有了明显的提高。句子结构分析实验结果表明,基于语义类的头驱动的句子结构分析统计模型,其召回率和精确率的值相应为88.26%和88.73%,综合指标改进了8.39%。
2017, 32(1):182-190. DOI: 10.16337/j.1004-9037.2017.01.022
摘要:对于多径频率选择性衰落信道以及低信噪比环境下线性调制信号的同步参数盲估计问题,提出基于循环累积量的载波频偏、初始相偏和符号定时误差前向联合盲估计算法。通过理论推导得出多径频率选择性衰落信道下信号的循环累积量与初始相偏和符号定时误差的数学关系。在此基础上先以较大频率间隔进行粗估计确定频偏范围,再以较高精度遍历检测信号特定循环频率,提高载波频偏估计精度,进而由累积量值估计出初始相偏和符号定时误差,不依赖于信道衰落和加性噪声的分布特性,尤其适用于频偏、相偏、定时误差和信道衰落同时存在的复杂情况。仿真结果表明,该算法 能有效实现低信噪比和多径频率选择性衰落信道下对线性调制信号同步参数的联合盲估计。
2017, 32(1):191-197. DOI: 10.16337/j.1004-9037.2017.01.023
摘要:脑机接口(Brain-computer interface,BCI)是一种 新颖的人机交互方式,是通过人的大脑意图和计算机直接进行交流。本文提出了一种基于伪随机序列调制彩色视觉刺激,产生彩色瞬态视觉诱发电位(Chromatic transient visual evoked potential, CTVEP)的BCI系统设计与信号处理方法。根据视觉特性,彩色圆环的交替呈现与消失作为视觉刺激被证明更加舒适和安全。在本文研究中,屏幕上同时呈现36个 彩色圆环刺激,每个刺激的呈现与消失模式由相互正交的36个伪随机Gold序列中的唯一的一个给定。针对采集的枕区脑电信号,利用Gold序列的正交性,本文给出CTVEP的解码方法,通过匹配滤波判断被试注视的刺激图案。通过对20名被试的实验,给出了系统的识别准确率 ,验证了此系统在“翻译”被试选择时的可靠性。
2017, 32(1):198-204. DOI: 10.16337/j.1004-9037.2017.01.024
摘要:情感倾向明显的表情符,容易通过人工进行标注。但是对于情感倾向不明显的表情符,多人手工的标注结果往往难以达成一致。因此,提出一种利用种子词自动判定表情符情感倾向的方法。该方法利用少量种子表情符自动标注情感倾向比较明显的表情符,生成表情符标注 集;对于情感倾向不明显的表情符,利用种子情感词和已得到的表情符标注集构建模型,实现其情感倾向的自动判定。实验结果表明,本文方法在微博表情符情感倾向的自动判 定上有很好的效果。
您是本站第 访问者
通信地址:南京市御道街29号 南京航空航天大学(明故宫校区)
邮编:210016 传真:025-84892742
电话:025-84892742 E-mail:sjcj@nuaa.edu.cn
技术支持:北京勤云科技发展有限公司
网站版权: © 《数据采集与处理》 编辑部