数据采集与处理  2018, Vol. 33 Issue (3): 564-574   PDF    
基于众包感知的OTT业务体验影响因素分析
徐小龙1 , 李克1 , 王海1 , 宋晓勤2 , 王征3 , 吴雄3     
1. 北京联合大学智慧城市学院, 北京, 100101;
2. 南京航空航天大学电子与信息工程学院, 南京, 210012;
3. 中国电信股份有限公司上海分公司, 上海, 200122
摘要: 随着移动互联网和OTT(Over-the-top)业务的高速发展,传统以网络为中心的运维方式难以为继,因此如何提高用户业务体验、变革传统网络质量的评价和优化方法迫在眉睫。本文围绕基于终端侧业务感知大数据进行网络和业务质量评价这一新型网络评价与运维作业模式,首先对影响端到端用户业务感知的因素进行了较全面的剖析;并利用从普通用户终端上采集的现网真实的海量业务感知数据,重点针对网页浏览这一代表性的OTT业务,从多个不同的维度深入研究影响业务感知的关键因素,以及关键业务感知指标间的关联关系,揭示了OTT业务感知的关键影响因素间的内在联系。研究结果对于进一步分析业务感知质差成因、合理构建用户体验质量(Quality of experience,QoE)映射模型等具有很好的参考价值。
关键词: 众包感知    业务体验    网络测量    OTT业务    
Crowdsourcing-based Analysis on Impact Factors of OTT Service Perception
Xu Xiaolong1, Li Ke1, Wang Hai1, Song Xiaoqin2, Wang Zheng3, Wu Xiong3     
1. College of Smart City, Beijing Union University, Beijing, 100101, China;
2. College of Electronics and Information Engineering, Nanjing University of Aeronautics and Astronautics, Nanjing, 210012, China;
3. China Telecom Corp. Ltd. Shanghai Branch, Shanghai, 200122, China
Abstract: Service perception analysis is the crucial solution to understand user experience and network quality, and the maintenance and optimization of the mobile networks. With the fast development of mobile Internet and OTT(over-the-top) services, the traditional network-centric mode of network operation and maintenance is no longer an effective way. In this situation, how to effectively evaluate and optimize user's service perception is getting more and more important. The key factors that impact on user's end-to-end OTT service perception is analyzed based on the so-called crowd sourcing based user perception monitoring methodology. Furthermore, the inner relationship among the key factors and the interaction between key quality indicators are evaluated from several aspects, by utilizing big data set of user perception collected from large amount of smart phone users in the real network. The results of analysis are highly valuable references for the improvement of user perception and network quality, network deployment and optimizations, etc.
Key words: crowdsourcing    service perception    network measurement    OTT service    
引言

基于互联网的信息传输通常提供的是实时性和可靠性较差但灵活性较强的服务,相比而言,基于电信网络的业务则具有高度的稳定性和可靠性。为保持其竞争优势,运营商通常会投入大量人力、物力到网络质量的评价和优化,并逐步形成了以网络为中心的网络运维模式。这样带来的问题就是运营商通常会站在网络的视角看问题,重网络质量而轻业务体验。随着移动网络传输能力的快速提升以及智能终端的普及,近年来互联网阵营的OTT(Over-the-top)业务得到了高速发展并逐步成为移动网络承载业务的主体,对电信运营商的传统自有业务形成了替代效应,最典型的例子就是微信对短信和语音业务的冲击。在这种新的形式下,移动网络有逐步沦为管道的危险,而仅仅通过保障网络质量已经难以保障良好的业务体验。因此,为了保障用户业务体验,降低客户流失风险,变革移动网络质量的测量、评价和优化方法迫在眉睫。

传统的移动网络运维主要依靠路测(Drive test, DT)和定点拨测(Call quality test, CQT)等手段、以网络关键性能指标(Key performance indicator, KPI)为目标来评价网络质量,更注重从网络层面而非业务层面进行评价和优化,网络质量和用户感知存在越来越大的剪刀差。为此,运营商逐步开始重视用户体验质量(Quality of experience, QoE)。研究人员也围绕业务关键质量指标(Key quality indicator, KQI)的数据采集和QoE的评价方法展开了相关研究[1-8]。虽然用户感知越来越重要,但目前数据采集和评价的手段仍有一定局限性,主要是通过在网络侧部署探针的方式如深度包解析方法(Deep packet inspection, DPI)[9]。一般来说,离用户越近则感知越准确,因此如何从用户侧获取感知信息尤为关键。运营商开始尝试采用基于终端侧用户感知大数据进行更加准确的网络和业务质量评价[10],希望以此牵引各相关业务部门共同协作促进业务感知的提升,进一步用于指导精准化的市场营销和客户服务,称之为众包用户感知方法(Crowdsourcing-based user perception, CUP)。

业务感知评价的最终目的是指导网络的优化调整以提升业务感知水平,这首先需要针对影响业务感知的因素进行分析和定位。本文针对上述问题,以网页浏览类应用为研究对象,基于在现网中采集的海量真实终端侧业务感知数据,通过多种数据分析和统计学手段,系统地分析了影响用户业务感知的各类因素,并从多个维度分析了这些因素对业务感知的影响机制,以及各主要影响因素之间、感知指标之间的关联关系。

1 相关工作

下面对常用的网络测量方法、QoE评价与分析进行简要分析,并对本文所采用的终端侧业务感知大数据的采集方法作重点阐述。

1.1 网络测量方法

网络测量与评价主要包括3个阶段:即数据采集、质量评价和数据分析。从数据采集的方式上来说,网络和业务测量方法主要分为两大类:主动测试和被动监测。从数据采集的位置来分,则包括终端侧采集和网络侧采集两大类。主动测试是最为传统也是最成熟的一种测量方式,其代表性方法是DT/CQT,例如文献[11]采用的就是从终端侧发起的主动测试,而网络侧的数据采集方法中最具有代表性也是目前应用最广的就是DPI技术。除此之外,还可以通过用户问卷调查的方式获得手机用户的主观业务感知质量信息,其代表性的方法为净推荐值(Net promoter score, NPS)[12]

主动测试的优点在于测试环境完全可控和透明,而其缺点是采集的样本点少,且只是测试人员在有限时间、地点对用户业务行为的有限模拟,难以反映全体用户的真实业务行为。此外,由于测试人员行为上的差异性,导致测试结果的公立性和准确性有较大的不确定性。由于电信业务过程中往往产生海量数据,因此被动监测方式获取到的电信数据天然具有大数据的特征,如何借助于大数据的手段进行数据分析得到了越来越多的重视。文献[13]中对于网络侧移动数据的采集和分析研究现状作了较为全面的论述,其中最具代表性的技术就是DPI。其最大优势是可以实现对网内全量用户的数据采集和分析,但部署成本高昂且局限于本网内,难以进行跨运营商网络的对标分析,对业务的识别和业务特征采集的准确性也受到解析技术的限制会有一定偏差。此外,随着https技术的广泛应用,其业务识别能力也面临很大挑战。

随着智能终端以及搭载了各种传感器的可穿戴设备的兴起,基于众包的终端侧测量得到了学术和产业界的重视。文献[14]中将这类测量方法命名为移动众包感知(Mobile crowdsensing, MCS),文中将其分为两种类型,即参与式感知和机会感知。前者需要个人的主动参与以贡献感知数据(如个人上传照片或报告实施路况等),而机会感知则以被动的、自治的方式工作,通常不需要用户的主动参与。

本文所采用的CUP方法属于机会感知的范畴,重点关注如何从用户智能终端上采集用户的实际在网业务信息,并进行网络和业务质量的评价分析。该方法具有很强的客观性,数据准确性很高,能够较全面地反映网络和用户的真实情况,但其最大难点在于APP的部署。可以采用独立的APP形式,但更多的则是作为SDK插件与其他APP捆绑。另一难点是如何避免对用户隐私的侵犯。此外,由于一般是基于操作系统层面之上的数据采集,其获取的无线参数较为有限,对于更深层次的网络数据比如空口信令更是无法获取。

1.2 基于大数据的QoE评价与分析

海量网络和业务数据的获取为更准确的QoE评价和分析提供了更丰富的信息,也吸引了学术界的广泛关注。文献[3]中探索了将大数据分析用于网络优化以提升用户QoE的问题,描述了一个大数据驱动的移动网络优化的框架,讨论了相应的机器学习大数据分析方案和大数据特征。文献[15]介绍了基于随机矩阵理论和机器学习的统一数据模型,提出了一个将大数据分析应用于移动网络的框架,并描述了几个典型应用场景,包括信令大数据、业务大数据和无线信号大数据等。

文献[16]基于网络侧话单数据(Call detail record, CDR)构建了典型移动互联网业务的用户感知评估体系,并提出了一种基于统计的用户感知问题的多维度定界方法;文献[17]则在终端众包感知数据和DPI数据相结合的基础上提出了移动互联网业务KQI的评测方法,以及基于统计的终端/无线/核心网/SP四段感知质差问题定界、定段、定位分析模型。

在QoE的影响因素分析方面,文献[5]中将QoE影响因素分为3个层面:服务层面、环境层面及用户层面。服务层面的影响因素则可以进一步包括网络层、应用层及服务层的参数。网络层的参数反映网络传输的状况,应用层的参数反映没有经过传输的服务的性能,服务层的参数确定了通信的语义、内容、优先级、重要性以及定价。环境层面的影响因素则包括自然环境、人文与社会环境以及服务运行环境等。用户层面的因素包括用户的期望、体验经历、用户体验时所处的身心状态和自身背景。但该文中对于具体业务场景下的影响因素以及这些因素与业务体验指标之间的相关性缺乏深入的分析,这正是本文的主要研究内容和贡献。

1.3 众包用户感知的数据采集

本文所采用的基于众包用户感知的数据采集与分析系统的系统架构如图 1所示。

图 1 CUP数据采集与分析系统的通用架构 Fig. 1 Common architecture of CUP data acquisition and analysis system

其中用户终端上安装了数据采集前端,通过在后台运行的方式监测用户的业务行为,并在设定的触发条件(比如用户用特定的浏览器APP访问了预定义的某个目标网站页面)下采集相关的业务感知和辅助信息并上传至云端的数据采集分析平台。分析平台对回传的原始数据进行相应的预处理,包括无效数据的剔除和用户信息的脱敏。通常不采集用户的高度敏感信息,包括手机号码、短信文本等,仅采集终端标识(International mobile equipment identity, IMEI)和用户标识(International mobile subscriber identity, IMSI)作为后台统计分析的用户标识,并在预处理中进行脱敏处理,包括IMEI/IMSI信息的加扰和加密等。采集的信息通常包括以下3类:

(1) 业务感知信息

这是最核心的采集信息。一般针对最具代表性的OTT业务类型,如网页浏览、视频播放和游戏等。对每类业务根据业务特征以及与用户体验的相关性定义若干KQI指标。具体而言,对于网页浏览类业务的感知指标主要体现在HTTP请求各阶段的时延,可根据业务需要进行相应的定义。例如文献[10]中所定义的指标包括首包时延、页面打开时延,还可以结合速率等指标。本文所采用的指标具体定义如下:

(a) 首包时延(Dk)。用户发起网页浏览请求到收到目标服务器响应的第1个HTTP 200 OK报文包之间的所经历的时长,即

$ {D_k} = {T_{200}} - {T_{{\rm{req}}}} $ (1)

其中Treq为用户发起网页浏览请求的时间点,T200为收到服务器第一个HTTP 200 OK报文的时间点。首包时延体现了服务器对HTTP请求的响应是否有反应及响应的快慢。

一次网页浏览过程包括若干环节,即DNS解析、TCP连接建立和HTTP交互,具体如图 2所示。因此这里的首包时延可进一步分解为3个分段时延指标之和,即

$ {D_k} = {D_{{\rm{dns}}}} + {D_{{\rm{tcp}}}} + {D_{{\rm{get}}}} $ (2)
图 2 网页浏览的交互过程 Fig. 2 Signaling process of web browsing service

其中

$ \left\{ \begin{array}{l} {D_{{\rm{dns}}}} = {T_{{\rm{dns}}}} - {T_{{\rm{req}}}}\\ {D_{{\rm{tcp}}}} = {T_{{\rm{tcp}}}} - {T_{{\rm{dns}}}}\\ {D_{{\rm{get}}}} = {T_{{\rm{200}}}} - {T_{{\rm{tcp}}}} \end{array} \right. $ (3)

式中:Ddns为DNS解析时延,即从发起页面浏览请求时刻到终端收到完成DNS解析的时刻Tdns的时间差。需要注意的是,如果在用户发起网页浏览请求的时刻终端尚未建立起空口连接,则该时延还包含空口建立时延;Dtcp为TCP连接建立时延,即从DNS解析完成到终端发出TCP连接确认的时刻的时间差;Dget为GET请求时延,即从终端发出TCP连接确认到收到第一个TCP数据包(包含HTTP 200 OK)的时刻T200的时间差。

(b) 页面打开时延(Dp)。用户发起浏览请求到收到目标服务器的第一个HTTP响应(仅页面文本内容,不包含资源的二次加载)、整个HTTP页面下载完毕并渲染完成的时长。页面打开时延反映了用户从访问开始到页面打开所需要等待的全部时间,是影响用户体验的最直接的感知指标。页面时延是在首包时延的基础上增加接收响应时延,即

$ {D_p} = {D_k} + {D_{{\rm{res}}}} $ (4)

其中Dres为接收响应时延,是指从收到第一个响应数据包到终端发出[FIN,ACK](即接收完成)的时刻的时间差,即

$ {D_{{\rm{res}}}} = {T_{{\rm{res}}}} - {T_{{\rm{200}}}} $ (5)

(2) 网络环境信息

每次监测到目标样本时,均同步采集当时的网络制式和基本网络参数(场强、信号质量和小区标识等),对不同的网络制式,具体的参数不同。例如对LTE网络,场强为RSRP,信号质量为RSRQ,小区标识为四元组{TAC, eNodeB ID, CI, PCI},这些信息表征了当时的网络质量的基本情况,这对于分析网络环境对业务感知质量的影响是重要的参考。

(3) 基础信息

主要包括终端信息、位置信息等。终端信息包括用户标识IMSI、设备标识IMEI、终端型号以及操作系统版本等,位置信息则包括采集业务感知样本时的终端经纬度、定位精度、定位方式(GPS定位或网络辅助定位)。

2 OTT业务感知质差的影响因素

对于一个OTT业务的业务过程而言,影响业务感知的因素涉及到端到端的各个环节,主要包括云、管和端3个部分,即业务服务器、移动网络(包括无线和核心两大部分)以及终端3大环节。具体可以将上述因素细分为6个维度进行分析,即:无线网、核心网、时间、终端、用户和ISP网站。

(1) 无线网:无线网相比核心网和ISP网站而言,由于地理环境和区域网络负载的多变性,其对用户业务感知的影响最为明显和不确定,是影响业务感知的最主要环节,也是优化提升的主要目标。具体而言,良好的无线网络首先体现在网络覆盖,即覆盖区域内各处的信号强度足够,更进一步则是信号质量良好(干扰较低)。

(2) 核心网:包括核心网设备和传输链路。核心网由于影响的面很广,且其传输环境可控,一般运营商会在核心网的运行维护上提供非常高级别的保障,因此其性能稳定,很少会影响到用户的业务感知。

(3) 时间(负载)因素:用户的业务发起具有随机性,同时在分布上也存在统计特征,这种用户业务需求的时间差异化特征对无线网、核心网和ISP网站都会形成冲击从而影响到业务体验。这种由于用户业务需求在时间上的不均衡性具体表现为网络设备负载的差异性。高负载时段一般来说会导致用户业务感知的明显下降。

(4) 终端因素:智能终端尤其是安卓智能终端,其碎片化特征明显,品牌和机型众多,不同的硬件能力对用户的业务体验有明显的影响,相对而言,高端机型由于其良好的硬件配置和软件优化能力,其业务的体验会优于低端机型。

(5) 用户因素:具体的用户由于其终端的个体化性能差异和使用习惯,以及不同个体对业务感知良好的心理认知和接受程度上的差异,反映在业务感知的评估结果上也会存在差异。

(6) ISP因素:对于大型OTT业务提供商,为保障用户体验,一般会大量采用内容分发网络(Content distribution network, CDN)[18]的方式将内容下沉以就近提供服务。因此,即使同一网站由于其网站CDN服务器布放的位置、处理能力和带宽的差异,也会对不同地区的用户业务感知带来差别。

对于基于HTTP协议的业务,域名的解析需要DNS服务器,一般布放在运营商网内,有的也会利用第三方服务器提供域名解析。DNS服务器的处理能力和带宽也会影响网页浏览业务的用户体验。

3 业务感知影响因素的相关性分析

本节重点从无线网、时间(负载)、终端、ISP等几个主要维度,以网页浏览类业务为例,利用从现网中实际采集的海量业务感知大数据进行分析,从而验证上述影响因素对用户体验的实质性影响。数据来源于普通用户智能终端并已做了脱敏处理。采集所涉及的目标网站包括新浪、百度和搜狐等9个国内主流网站,所有样本均在LTE网络下获得,总有效样本数为7 434 030个。

3.1 无线覆盖对业务感知影响的相关性分析

对于无线网络而言,良好的信号覆盖是业务感知的重要基础,其中最基本的指标是业务发生时所在位置的信号强度,其次是信号质量,即干扰水平,对LTE网络分别是参数RSRP和RSRQ。信号强度和信号质量越好,其空口的数据交互成功率和时延也越好,进而带来更好的业务体验。

首先分析覆盖能力对于业务感知指标的影响,即信号强度和信号质量与业务感知指标之间的相关性。不同RSRP水平下的平均首包时延和页面打开时延的分段分布情况如图 3所示。

图 3 RSRP与平均首包时延/页面打开时延的关系 Fig. 3 Relationship between RSRP and average first packet delay/page open delay

图 3中Median曲线为中位数,Q1和Q3分别为该RSRP分段上的KQI指标1/4分位数和3/4分位数。由此可以看出当场强小于-110dBm时(对LTE网络而言,一般将场强低于-110dBm的情况定义为弱覆盖),两个指标均出现了明显的恶化,这表明信号强度对浏览类业务的感知指标影响较大。对RSRQ和首包/页面打开时延的箱体图分析的结果与此类似。由此可见,无线环境质量对于端到端业务感知具有直接的影响,是业务感知保障优化工作中需要重点关注的因素。

3.2 网络负载对业务感知的影响

由于从终端侧无法获得网络负载信息,作为一种替代方案,分析一天不同时间段内的业务感知指标的差异,观察不同时间用户不同的业务使用强度对感知指标的影响。一般而言,一天之中不同时间段的业务使用强度是不同的。图 4是根据业务行为数据分析得到的网页浏览类业务在不同时段的业务活跃度(即业务发起时间占比)。可以看出,在23点~7点之间的夜间时段,业务使用强度很低,也即网络负载很低。

图 4 不同时段的网页浏览业务活跃度分布 Fig. 4 Distribution of web browsing service intensity at different time periods

将业务感知采样数据按照不同时段进行统计,可以得到图 5的结果。从图中可以看出,感知指标的波动与业务活跃度分布的波动具有显著的相似性。这表明业务活跃度对于感知指标也具有显著的影响。

图 5 首包时延/页面打开时延在不同时段的水平 Fig. 5 Average first package delay and page open delay at different time periods

还可以进一步对上述因素间的相关性进行定量评价。相关性的量化评价的传统方法是计算Pearson相关系数(Pearson correlation coefficient, PCC)。PCC是基于协方差和标准偏差的估计,两个样本集合的Pearson相关系数为

$ r = \frac{{\sum\limits_{i = 1}^n {\left( {{X_i} - \bar X} \right)\left( {{Y_i} - \bar Y} \right)} }}{{\sqrt {\sum\limits_{i = 1}^n {{{\left( {{X_i} - \bar X} \right)}^2}} } \sqrt {\sum\limits_{i = 1}^n {{{\left( {{Y_i} - \bar Y} \right)}^2}} } }} $ (6)

其中{Xi, i=1~n }{Yi, i=1~n }是所观察到的两组样本,XY分别是其均值。

为了进一步验证该观察,同时采用另一种方法,即最大信息系数(Maxinal information coefficient, MIC),以检测为两个变量的独立性关系[19-20]。经证明,MIC方法可以广泛地捕捉各类函数或非函数的关联性,其中一些甚至是通过其他方法如PCC方法、Kraskov互信息估计器[21]所无法发现的。MIC的定义如下。

对于一个有限集合D$\subset $R2和正整数xy,定义

$ {I^ * }\left( {D,x,y} \right) = \max I\left( {D\left| {_G} \right.} \right) $ (7)

其中,求最大值是指对于xy分辨率的网格分割,通过调整X轴和Y轴的分割点所能计算得到的最大互信息值。有了在不同分辨率下得到的I*,可以构造特征矩阵并求得有限集合D的特征矩阵。

定义二维集合D的特征矩阵M(D)是一个无穷矩阵,即有

$ \mathit{\boldsymbol{M}}{\left( D \right)_{x,y}} = \frac{{{I^ * }\left( {D,x,y} \right)}}{{\log \min \left( {x,y} \right)}} $ (8)

经过标准化后的特征矩阵中元素的值均落在[0, 1]上。

集合D的最大信息系数则可以表示为

$ {\rm{MIC}}\left( D \right) = \mathop {\max }\limits_{xy < B\left( n \right)} \left\{ {M{{\left( D \right)}_{x,y}}} \right\} $ (9)

其中对于0 < ε < 1,存在ω(1) < B(n)≤O(n1-ε)。B(n)的建议值为n0.6

根据MIC的定义可见,MIC具有普适性、公平性和对称性等性质。所谓普适性,是指在样本量足够大(包含了样本的大部分信息)时,能够捕获各种各样的有趣关联,而不限定于特定的函数类型(如线性函数、指数函数或周期函数),或者说能均衡覆盖所有的函数关系。一般变量之间的复杂关系不仅仅通过单独一个函数就能够建模,而是需要叠加函数来表现。所谓公平性,是指在样本量足够大时能为不同类型单噪声程度相似的相关关系给出相近的系数。例如,对于一个充满相同噪声的线性关系和一个正弦关系,一个好的评价算法应该给出相同或相近的相关系数。可以看到,随着噪声程度的增加,这些方法对某些函数关系表现出的健壮性不一致。利用MIC可以大大减少数据清洗的麻烦,只要有足够的数据量可以代表总体信息,就可以直接用MIC计算分析。用PCC和MIC方法分别计算首包时延和页面打开时延与不同时段业务活跃度的相关性,结果如图 6所示。显然,从图 8可以看出,无论是首包时延还是页面打开时延,都表现出与业务活跃度显著的相关性。

图 6 KQI指标与业务活跃度的定量相关分析 Fig. 6 Quantitative correlation analysis between KQI index and service intensity

图 8 分段时延的PCA/EFA因素分析 Fig. 8 Analysis of PCA and EFA of segment delay

3.3 网站与业务感知指标的关系

对于网页浏览业务而言,对于不同的网站由于其网页大小不同,需要下载的页面大小也不一样,因此,页面打开时延指标有可能受到页面大小的影响。为此将业务感知指标数据按照不同的网站进行统计,结果如图 7所示。

图 7 不同网站的KQI指标对比 Fig. 7 Comparison of KQI indexes of different websites

图 7可以看出,不同网站的首包时延基本处于同一水平,这是因为首包时延主要取决于网站对终端侧网页请求的响应速度,与页面大小无关;而页面打开时延则与页面大小有明显的相关性,反映出页面打开时延与首页数据的传输时延相关性更高,与空口速率密切相关。因此,在评价页面打开时延的优劣时,如果对不同网站均采用相同的优劣判决门限则有失公平,因为不同区域的各类网站的样本数分布具有一定的差异性。因此,参考各网站的页面大小、本地用户对各网站的访问频度的偏差对页面打开时延指标的优劣判决门限进行加权归一化,以避免由于网站自身和用户访问偏好的差异性带来的评价结果的偏差。

假设本地区n个目标网站的页面大小分别为{Pi, i=1~n},平均页面大小为P=mean(Pi),各网站的用户访问量占比为{αi, i=1~n}且$\sum\limits_{i = 1}^n {} $αi=1,设页面打开时延的基本劣质门限为T0,即

$ {T_0} = 1.25\sum\limits_{i = 1}^n {{{\bar D}_{pi}}} \cdot {\alpha _i} $ (10)

其中Dpi为第i个网站的平均页面打开时延,则第i个网站的页面打开时延劣质门限可以按下式计算确定,即

$ {T_i} = {T_0} \cdot {\beta _i} \cdot \frac{{{P_i}}}{{\bar P}} $ (11)

其中βi为控制参数。

3.4 终端资源负荷与业务感知指标的关系

终端的计算资源主要指CPU和内存。过高的CPU和内存占用会导致终端的计算能力和响应能力的下降,影响到APP的运行。因此,为了确定通过浏览器APP进行的网页浏览业务的用户体验是否受终端资源负荷的影响,对业务感知指标与不同终端资源负荷的相关性指标即MIC进行计算,如果如表 1所示。可以看出,首包时延和页面打开时延与CPU和内存之间无明显相关性,即终端资源负荷对业务感知指标无明显影响。

表 1 终端资源负荷与首包/页面打开时延的MIC分析 Tab. 1 MIC analysis of terminal resource load and first packet delay and page open delay

3.5 业务感知影响因素的降维分析

对于业务感知指标而言,在采集KQI指标样本的基础上,进一步需建立KQI-QoE映射模型以便更直观地评价业务体验。为了减少KQI指标间的冗余对模型的影响,需要对指标集合进行降维分析,以确定最终用于构建模型的KQI指标集合。具体对网页浏览类业务而言,一种方式是将首包时延和页面打开时延作为输入KQI指标集,另一种方法则是将分段时延指标{Ddns, Dtcp, Dreq, Dres}作为输入,这时需要对该指标集合中的4个分段指标进行降维分析。

最常用的降维分析是主成分分析法(Principal component analysis, PCA)。其目的是用1组较少的独立变量代替大量相关变量,同时尽可能保留初始变量信息,推导所得的变量称为主成分。探索性因子分析法(Exploratory factor analysis,EFA)也是一项用来找出多元观测变量的本质结构、并进行降维的技术,在教育和心理学评价中应用较多[22]。它主要是为了找出影响观测变量的因子个数,以及各个因子和观测变量间的相关程度, 其基本模型为

$ \mathit{\boldsymbol{X}} = \mathit{\boldsymbol{ \boldsymbol{\varLambda} \boldsymbol{\varXi} }} + \mathit{\boldsymbol{ \boldsymbol{\varDelta} }} $ (12)

其中X=(x1, x2, …, xk)TK维观测变量向量,Ξ=(ξ1, ξ2, …, ξm)Tm维公共因子向量(m < k),Δ=(δ1, δ2, …, δk)T为对应各观测变量的唯一性因子(表示该变量不能被公共因子所解释的部分)和观测变量随机误差之和。Λ=${\left[\begin{array}{l} {\lambda _{11}}\;\; \cdots \;\;{\lambda _{1m}}\\ \;\; \vdots \;\;\; \ddots \;\;\;\; \vdots \\ {\lambda _{k1}}\;\; \cdots \;\;{\lambda _{km}} \end{array} \right]_{k \times m}}$为负载矩阵,各元素为对应的各公共因子的权重。分别应用PCA和EFA方法对可能影响页面打开时延的4个分段指标即DNS解析时延、TCP连接建立时延、GET请求时延和接收响应时延进行分析,结果如图 8所示。由图可知,两条红线分别表示PCA和EFA的阈值,高于红线部分为PCA和EFA算法建议选取的因子数。由上图可知,EFA建议提取3个因子,而PCA建议提取一个因子。考虑到高估因子通常比低估因子数的结果好,同时为了尽可能避免曲解“真实”情况,可以选择EFA法得到的因子结构进行建模分析。又因为4个分段指标对页面打开时延的影响可看作是独立的,因此选用正交旋转的方法提取因子,以便对结果做出更直观合理的解释,结果如表 2所示。

表 2 EFA各因子得分{aij} Tab. 2 EFA factor scores {aij}

由此可得

$ {\xi _j} = \sum\limits_{i = 1}^4 {{x_i}{a_{ij}}} \;\;\;j = 1,2,3 $ (13)

式中:ξj代表第j个公共因子;xi分别代表 4个分段时延观测变量;aij代表每一个分段时延对应的权重。

由EFA计算结果进一步可知,第1主成分ξ1的贡献率是25%,其中TCP连接建立对页面打开时延的影响最大。其次是第2主成分ξ2,其贡献率为24%,其中DNS解析对页面打开时延的影响最大。而ξ3中则是以接收响应时延对页面打开时延的影响为最大。基于此,可采用{ξj, j=1, 2, 3}作为输入构建KQI-QoE映射模型。

4 结束语

本文针对传统移动网络运维和优化作业模式在OTT业务越来越占据主导地位的当前情况下所面临的诸多问题,对影响端到端用户业务感知的因素进行了较全面的剖析。重点围绕网页浏览类业务,利用从普通用户终端上采集的现网真实的海量业务感知数据,从多个不同的维度深入研究影响业务感知的关键因素,以及关键业务感知指标间的关联关系,揭示了OTT业务感知的关键影响因素间的内在联系。分析发现,无线覆盖能力对首包时延和页面打开时延的影响较为突出,尤其是在弱覆盖场景下,KQI指标会出现迅速恶化,揭示了无线覆盖对于业务感知的直接而重要的影响。其次对于时间维度上首包和页面打开时延所受的影响进行了定性和定量的相关性分析,结果均表明不同时段的业务活跃度水平与KQI指标间具有强相关性。网站维度的分析可以看出,首包时延与网站的关联性较低,而页面打开时延则受页面大小的影响很大。基于此,本文提出了一种页面打开时延劣质门限的计算方法,可以较好地解决不同网站页面大小以及用户访问偏好所带来的公平性问题。最后引入PCA和EFA分析方法研究分段时延用于QoE建模时的降维问题,并给出了相应的KQI指标选择建议。本文通过分析影响业务感知的关键因素,可以很好地用于指导用户业务感知优化工作,对于进一步分析业务感知质差成因、合理构建QoE映射模型等具有较高的参考价值。

参考文献
[1]
Qiao Zizhi. Smarter phone based live QOE measurement[C]//Proc 15th Int'l Conf on Intelligence in Next Generation Networks (ICIN2011). Berlin, Germany: [s. n. ], 2011: 64-68.
[2]
Huang Fenghui, Zhou Wenan, Du Yu. QoE issues of OTT services over 5G network[C]//Proc 9th Int'l Conf Broadband and Wireless Computing, Communication and Applications (BWCCA2014). Guangzhou, China: [s. n. ], 2014: 267-273.
[3]
Zheng Kan, Yang Zhe, Zhang Kuan, et al. Big data driven optimization for mobile networks towards 5G[J]. IEEE Network Mag, 2016, 30(1): 44-51. DOI:10.1109/MNET.2016.7389830
[4]
Kamel A, Al-Fuqaha A, Guizani M. Exploiting client-side collected measurements to perform QoS assessment of IaaS[J]. IEEE Trans Mobile Computing, 2015, 14(9): 1876-1887. DOI:10.1109/TMC.2014.2370648
[5]
林闯, 胡杰, 孔祥震. 用户体验质量(QoE)的模型与评价方法综述[J]. 计算机学报, 2012, 35(1): 1-15.
Lin Chuang, Hu Jie, Kong Xiangzhen. A review of the models and evaluation methods of user experience quality (QoE)[J]. Journal of Computer, 2012, 35(1): 1-15.
[6]
Aggarwal V, Halepovic E. Prometheus: Toward quality-of-experience estimation for mobile apps from passive network measurements[C]//Proc ACM HotMobile'2014. Santa Barbara, USA: [s. n. ], 2014: 26-27.
[7]
Oyman O, Singh S. Quality of experience for HTTP adaptive streaming services[J]. IEEE Communications Magazine, 2012, 50(4): 20-27. DOI:10.1109/MCOM.2012.6178830
[8]
Singh K, Hadjadj-Aoul Y, Rubino G. Quality of experience estimation for adaptive HTTP/TCP video streaming using H. 264/AVC[C]//Proc 9th Annual IEEE Consumer Communications and Networking Conference. Las Vegas, Nevada, USA: IEEE, 2012: 127-131.
[9]
Kumar S, Turner J, Williams J. Advanced algorithms for fast and scalable deep packet inspection[C]//Proc of ACM/IEEE Symposium on Architectures for Networking and Communications Systems. San Jose, USA: [s. n. ], 2006: 81-92.
[10]
中国电信集团公司技术标准[S]. 中国电信移动互联网业务感知测试APP功能规范, 2015.
Technical Standard of China Telecom[S]. Functional Specification of China Telecom Mobile Internet Service Perception Test APP, 2015.
[11]
张成伟, 程文青, 黑晓军. 基于Android平台的3G移动网络测量研究及性能分析[J]. 计算机科学, 2015, 42(2): 24-28.
Zhang Chengwei, Cheng Wenqing, Hei Xiaojun. Research and performance analysis of 3G mobile network based on android platform[J]. Computer Science, 2015, 42(2): 24-28. DOI:10.11896/j.issn.1002-137X.2015.02.005
[12]
爱立信. 用大数据提升运营商NPS[J]. 电信工程技术与标准化, 2015, 28(3): 92.
Ericsson. Enhancing carrier NPS with big data[J]. Telecommunication Engineering Technology and Standardization, 2015, 28(3): 92.
[13]
Naboulsi D, Fiore M, Ribot S, et al. , Large-scale mobile traffic analysis:A survey[J]. IEEE Communications Surveys & Tutorials, 2016, 18(1): 124-161.
[14]
Ganti R, Ye F, Lei H. Mobile crowdsensing:Current state and future challenges[J]. IEEE Communications Magazine, 2011, 49(11): 32-39. DOI:10.1109/MCOM.2011.6069707
[15]
He Ying, Yu Fei, Zhao Nan, et al. Big data analytics in mobile cellular networks[J]. IEEE Access, 2016, 4(1): 1985-1996.
[16]
陈森, 陈超, 张小勇. 基于大数据分析的移动互联网用户感知评估系统[J]. 电信科学, 2015, 4: 1-8.
Chen Sen, Chen Chao, Zhang Xiaoyong, et al. Mobile Internet user perception evaluation system based on big data[J]. Telecommunication Science, 2015, 4: 1-8.
[17]
马啸威, 曹维华, 李文云. 移动互联网业务感知质量优化方法及系统[J]. 广东通信技术, 2017, 2017: 40-45.
Ma Xiaowei, Cao Weihua, Li Wenyun, et al. Optimization methodology and system for mobile Internet service perception[J]. Guangdong Telecommunication Technology, 2017, 2017(2): 40-45.
[18]
Gerber A, Hajiaghayi M, et al. To cache or not to cache:The 3G case[J]. IEEE Internet Comput, 2011, 15(2): 27-34. DOI:10.1109/MIC.2010.154
[19]
Reshef D, Reshef Y, Finucane H, et al. Detecting novel associations in large data sets[J]. Science, 2011, 334: 1518-1524. DOI:10.1126/science.1205438
[20]
Reshef D, Reshef Y, Finucane H, et al. Supporting online material for detecting novel associations in large data sets[EB/OL]. http://science.sciencemag.org/content/suppl/2011/12/14/334.6062.1518.DC1. 2011.
[21]
Kraskov A, Stogbauer H, Grassberger P. Estimating mutual information[J]. Phys Rev E, 2004, 69: 1-16.
[22]
孙晓军, 周宗奎. 探索性因子分析及其在应用中存在的主要问题[J]. 心理科学, 2005, 28(6): 1440-1442.
Sun Xiaojun, Zhou Zongkui. Exploratory factor analysis and its main problems in application[J]. Psychological Science, 2005, 28(6): 1440-1442.