融媒体环境下视听传播效果评估的指标体系建构——基于VAR模型的大数据计算及分析

大数据
后台-插件-广告管理-内容页头部广告(手机)

作者

周勇,中国人民大学新闻学院副院长,教授、博士生导师、新闻与社会发展研究中心研究员。

赵璇,中国人民大学新闻学院2015级博士研究生。

本论文是国家社科基金重点项目“基于大数据的视听传播效果研究”(项目批准号:14AXW008)的阶段性成果。

正文

近年来,媒体技术的发展使媒介融合程度不断深化。在这一背景下,传统上基于小样本抽样调查、主要针对电视收看行为的收视调查方法已越来越表现出局限性,建立一套全面反映多屏时代视听信息传播效果的理论和方法体系成为理论界和实践界共同关注的迫切问题。

测量视听信息传播效果的路径

本文的研究对象为视听信息,主要指通过电视、PC、平板电脑、手机等各种终端多渠道传播的以音视频为主体的动态影像。其传播效果可以从多个方向来衡量,本研究主要考察多屏互动下视听信息产品的观众注意力和口碑。相关研究中对其量化评估一般有两条路径:一是对观众的媒体接触行为进行测量,二是考察观众对于视听信息的满意度以及哪些因素会影响观众的态度。

(一)观众媒体接触行为测量

1.电视受众测量:传统收视率调查

早在上世纪三十年代,美国公司就开始采用抽样的方式,通过电话调查、日记卡的方式来进行收听率、收视率的调查。在效率优先的美国商业广播体制下,内容产品的评价与电视机构的经营直接挂钩,收视率调查体系能直观反应内容产品的市场规模,因而逐渐成为美国最主流的电视传播效果评价标准。我国各大电视台虽然一直在尝试将更为多元化的指标纳入节目效果评估,但目前总体而言还是以收视率作为主要考核标准。从全球范围来看,目前收视率调查呈现两大特点:一家垄断为各国常态;少数国际公司掌控全球收视率调查(刘德寰等,2009)。我国目前的收视率调查市场中,中国广视索福瑞媒介研究(CSM)基本上处于一家独大的垄断地位,尼尔森曾一度退出中国市场后又回归。

2. 多屏互动下的视频受众测量

随着技术的发展,电视与网络之间在内容和渠道上的界限都在渐渐模糊。相应的,对于观众收视行为的测量也从单一的电视受众测量向多渠道多终端的视频受众测量转变。基于回路数据的电视时移和实时收视率测量。总体而言,目前对于时移收视的监测技术已经比较成熟,但还不完善,没有公认的标准和计算口径。网络观看行为测量。由于收看渠道和终端的多样化,网络端视听信息传播效果的测量有多种技术,采集到的数据结构也不尽相同。主要的采集方式有三种,其一是通过爬虫技术对网络数据进行抓取;其二是在用户端安装软件,可以监测样本用户在各个视频网站观看视听信息的行为;其三是在视频网站或服务器端植码,获得的是在所植码网站或服务器的所有用户观看行为。

3. 社交媒体兴起下视频产品的用户测量

互联网、手机等新媒体的出现正在瓦解传统电视以时序为核心的内容组结方式,使得内容的呈现由固化走向离散(周勇,2011)。而社交媒体的出现则将这种离散和碎片化的特征放大并发挥到了极致。在社交媒体上,官方花絮、明星的单人剪辑版、粉丝制作的视频等与节目相关的其他内容,由于时长便于传播或者目标受众更为明确而更具扩散力和影响力。在这一过程中,信息接收者从被动的观众转变为主动的用户,因此,传统的受众测量也开始向用户研究转变。

(二)观众态度测量及其影响因素研究

尽管收视率调查逐步系统化后,直接、便捷地为业界和学界提供了公认的收视行为测量数据,但大多数学者还是认为仅以收视率数据对节目进行评估有失偏颇。收视率数据只能显示观众收看节目的人数,但不能评估节目本身的质量,也不能度量观众对节目的喜好和满意程度。

1. 早期观众满意度测量研究

不同于美国的商业广播电视体制对于市场效益最大化的追求,以英国为代表的公共广播体制的电视评估更注重综合性,关注公共价值,也使用收视率测量,但不唯收视率,BBC主要从四个方面来衡量“公共价值”:

(1)到达率:到达率(每周15分钟以上)、到达率较低的观众群到达情况分析、每周平均收看时长、观众市场份额;(2)品质:满意度、欣赏指数、得奖数量及比例、平面媒体报道数量及正负向报道比例、独特性与创新性评估;(3)影响力:记忆度、影响因子(记忆度与观众份额的比例)、信任度及行为影响、平面媒体报导、社会及教育性活动的影响力测量;(4)消费价值:每位观众成本、观众每小时成本、消费价值认知调查(BBC,2005)。

不同于英国BBC的以频道为单位的评估模式,美国公共电视的评估则主要集中在节目评估的层面。美国传播研究处1978年开始推动一系列节目品质研究计划来服务公共电视的评估工作。比如,在样本户电视机上安装电子装置VOXBOX,装置上设有9个评价节目质量的按键,包括“非常好的”、“提供有用信息的”、“可信的”、“有趣的”、“无聊的”、“不可信的”、“愚笨的”、“看不下去要转台”、“演员角色表现”,观众可以按下相应的按键来表达对电视节目的看法,数据通过电话线回传。还有采用邮寄问卷的方式,调查观众对于节目的认知度、接触度、节目偏好等方面的情况;而且该调查中还有专门的指标来测量特定分众的节目是否受到目标观众的喜爱。

2. 基于大数据的视听信息舆情研究

进入多屏互动时代,大数据为视听信息的满意度研究带来了更多的从方法上进行革新的可能性。测量数字电视的回看、点播,以及网络收看的市场规模,仅反映了新的传播渠道带来的收视增量,并不能完全反映新媒体所产生的影响。社交媒体所提供的更多的不是视听信息本身,而是二级信息,即关于信息的信息(斯特拉特,2005/2016:158)。对“关于信息的信息”的测量与分析,即是社交媒体时代的满意度分析。相比于传统的舆情分析方法,大量用户在网络上的言行储存累积下来的大数据无疑成为舆情研究的利器。

具体到视听信息的传播,对于新闻节目,网络中讨论大多是基于新闻中的事件,事件性的节目与社会舆论的关联性是结构人们社会活动的非常重要的方面,与上述舆情研究的内容基本重合;对于电视剧、综艺等娱乐节目的网络舆情测量,则主要由营销方来驱动。总体而言,大部分研究都是基于上述类似的指标,包括节目的提及量、讨论量、评论正负面信息的比例等。

视听信息传播效果

评估指标体系的建构

如何将不同渠道和终端的用户收视行为数据和满意度数据进行整合一直是效果研究的难点,因为各方数据不同源不同结构、且存在数据孤岛的问题,因而采用建构指标体系模型的方式将各渠道、终端的传播效果结合在一起是比较合理和易操作的方式。

(一)视听信息传播效果评估指标体系研究现状

建立传播效果评估指标体系的路径,目前主要是通过抓取网络公开数据来建立模型,学界和业界均已有不少相关的研究。本文综合相关研究者的成果,将其中涉及到的主要维度和指标归纳如下:

融媒体环境下视听传播效果评估的指标体系建构——基于VAR模型的大数据计算及分析

总体而言,现有的指标体系建构研究主要存在以下可以改进的地方:其一,指标的选取方面,业界更全面,学界更具理论依据,但两者都未能考察各指标的有效性,没有对指标模型进行校验和优化。其二,指标体系中各指标权重的确定,目前主要有三种方式:等权重、德尔菲法以及德尔菲法与层次分析法相结合。这三种方法主要是凭借研究者或者相关专家的经验,缺乏客观数据的说服力。其三,虽然大部分研究都是通过抓取网络上的大量数据来建立模型,但并没有充分利用大数据的优势,只是简单的将指标数据与通过经验性的方法获得的权重相结合,而没有对大数据进行数据挖掘,来探讨数据之间的关系。

(二)本研究的维度构建与指标选取

心理学中将态度分为认知、情绪/情感和行为三个维度,因而本研究拟从这三个维度去测量观众对视听信息的态度。整个指标体系模型的建立将分为两步:第一步,各维度下研究指标的初步选取将基于前人的经验,尽可能全面,囊括各方面可能会产生影响的指标。第二步,在积累了一定的数据之后,分析各指标的信效度,对指标进行取舍,优化模型。本节主要介绍初步纳入测量的细化指标及其测量方式,后文将对具体研究方法进行更详细的说明。

融媒体环境下视听传播效果评估的指标体系建构——基于VAR模型的大数据计算及分析融媒体环境下视听传播效果评估的指标体系建构——基于VAR模型的大数据计算及分析

研究方法

(一)研究对象的选取

1. 以电视剧作为研究对象

视听信息中,新闻、电视剧和综艺节目的观众关注度最高。但新闻节目在电视上和网络上播出形式差异较大,网络上多为新闻短视频,整合分析难度较大;综艺节目多为周播,播出周期较长,不方便数据收集;而且相关数据(综艺报,2017)显示,2017上半年,全网近6.3万档不同类型节目视频点击总量达5007亿次,电视剧内容以3360.1亿次的视频点击量占据超六成点击,遥遥领先于其他类型节目。故选取电视剧作为本研究的研究对象。

2. 电视剧的选取

在研究执行期间,抓取百度电视剧排行榜中每天排名前五十的电视剧,进入榜单且有在电视上播出的电视剧都作为本研究的研究对象。

(二)指标体系的建构与优化

1. 数据收集

以“天”为单位,通过爬虫技术持续抓取进入研究范围的电视剧每天在各个指标上的相关数据。

2. 确定权重

本研究通过建构统计模型来计算权重,选取“次日收视率”作为传播效果指标体系模型的拟合目标,考察当天的电视、网络收看情况以及网络中该电视剧的舆论声量等指标对次日观众收看行为的影响。然后通过建构统计模型,将指标体系与拟合目标的最优解作为各指标的权重。

3. 模型的优化

通过新数据的加入,在计算和拟合的过程中,不断对指标体系进行调整和优化,以获得最简洁有效的传播效果评估体系。

(三)统计模型的选择

从理论上来说,大数据方法代表了一种新经验主义范式,当数据量足够大,可以覆盖所有或绝大部分样本空间时,就可以不再需要通过模型判别新样本,而是可以直接从数据库中调取相同或者非常相近的数据来推测结果。但社会科学中往往样本空间过大而且总处于变动之中,研究中难以获得足够覆盖样本空间的数据量,所以仍然需要通过建构模型来提供适当的泛化能力。本文引入经济学中常用的向量自回归模型(VAR)来分析这些指标之间的关系。

向量自回归是基于数据的统计性质建立模型,VAR模型把系统中每一个内生变量作为系统中所有内生变量的滞后值的函数来构造模型,从而将单变量自回归模型推广到多元时间序列变量组成的“向量”自回归模型。VAR模型常用于预测相互联系的事件序列系统及分析随机扰动对变量系统的动态冲击,因而,本文将引入VAR模型来分析时间维度上网络收看行为、网络舆情各指标与收视率之间的相互影响关系。

研究结果

(一)基于VAR模型的收视率预测

1. 数据来源与处理

本文数据收集期为2017年8月1日至9月17日,选取了在此期间在电视上首播且在多天进入过百度电视剧排行榜前50的10部电视剧(见表3)作为研究对象,收集了这10部电视剧以上各指标每天的相关数据,以一天的数据作为一期,使用的软件是Eviews9.0。在进行VAR模型分析时,为了消除可能存在的异方差的影响,分别对各指标进行取对数处理。

融媒体环境下视听传播效果评估的指标体系建构——基于VAR模型的大数据计算及分析

2. VAR模型的估计

由于本文仅选取了10部电视剧,指标体系中的电视播出频道、电视播出时间、网络播出平台等指标之间的差异不大,因而未能进入模型。目前纳入VAR模型进行分析的八个指标以及最优滞后阶数的选取,都是运用软件计算检验,经过多次尝试后确定的。回归估计结果如下:

LRating = 0.109*LBaiduIndex(-1) - 0.290* LBaiduIndex(-2)+0.255*LRating (-1) + 0.043*LRating (-2) - 0.560*LDayPlaytimes(-1) +0.838*LDayPlaytimes(-2) + 0.113*LMediaCount(-1) - 0.487*LMediaCount (-2)+ 0.167*LPerPositive(-1) - 0.111*LPerPositive (-2) + 0.091*LWeiboIndex(-1) +0.090*LWeiboIndex(-2) + 0.524*LWeiboTopic(-1) + 0.042* LWeiboTopic(-2)- 0.410*LWeixinArticle(-1) - 0.300* LWeixinArticle (-2) + 0.6022

上述回归模型中所估计系数的t统计量值大部分在10%显著水平下是显著的,尽管有部分系数不显著,我们仍选取滞后期数为2的模型。部分系数不显著可能是由于在同一个方程中有同样变量的多个滞后值产生了多重共线性造成的。对 VAR 模型而言,单个参数估计值的解释是困难的,其应用除预测外,更重要的应用是用于结构分析的脉冲响应分析和方差分解。

3. 模型平稳性检验

VAR模型的有效性建立于模型的稳定性之上,如果模型不稳定,某些结果将不具备有效性。因此下面对估计出的模型进行稳定性检验。本文利用AR根进行检验,如果估计的 VAR 模型所有根模的倒数小于1,即位于单位圆内,则其是稳定的。从图1可以直观地看出,所有的单位根都落于单位根圆内,因此所设定的模型是稳定的,表明选取的变量之间存在长期稳定关系,可以进一步进行分析。

融媒体环境下视听传播效果评估的指标体系建构——基于VAR模型的大数据计算及分析

4. 格兰杰因果关系检验

格兰杰因果检验主要是用来检验某个变量是否受其他变量的滞后变量的影响,如果一个变量受其他变量的滞后变量的影响,则称它们之间具有格兰杰因果关系。本文 VAR模型中各变量的格兰杰因果关系检验结果如表4所示。

融媒体环境下视听传播效果评估的指标体系建构——基于VAR模型的大数据计算及分析

考察各变量两两之间的格兰杰因果关系,从上表的检验结果可得出在 5%的显著性水平下,滞后期的网络日增播放量和微信公众号的文章数量对收视率有影响,滞后期的微信公众号文章数量对媒体转载量有影响,滞后期的百度指数对正面评论的比例有影响,滞后期的网络日增播放量和媒体转载量对微博话题的热度有影响,滞后期的百度指数、收视率、网络日增播放量、媒体转载量、微博热议度都对微信公众号文章数量有影响;在10%的显著性水平下,滞后期的网络日增播放量对正面评论的比例有影响,滞后期的微信公众号文章数量对微博热议度有影响,滞后期的微博热议度对微博话题的热度有影响。

融媒体环境下视听传播效果评估的指标体系建构——基于VAR模型的大数据计算及分析融媒体环境下视听传播效果评估的指标体系建构——基于VAR模型的大数据计算及分析

当把收视率作为因变量时,其他变量与收视率的格兰杰因果关系如表5所示,虽然单个变量中只有网络日增播放量和微信公众号文章数量的卡方检验有显著性,但表的最后一行(ALL)显示所有滞后内生变量联合作用对收视率的影响是显著的。

5.脉冲响应分析

脉冲响应函数描述的是一个内生变量对残差冲击的反应,具体而言,它描述的是在随机误差项上施加一个标准差大小的冲击(来自系统内部或外部)后对内生变量的当期值和未来值所产生的动态影响。在VAR 模型中,当某一变量t 期的扰动项变动时,会通过变量之间的动态联系,对 t 期以后各变量产生一连串的连锁反应,脉冲响应函数将描述系统对冲击扰动的动态反应,并从动态反应中判断变量间的时滞关系。

考虑到样本容量,响应期设为10期,通过软件计算,得出结果如图2所示。从图2-1可以看出,当在本期给百度搜索指数一个正冲击后,收视率在短期内会呈现上下波动,收视率在第二期达到正向最大之后逐渐收敛。这表明在短期内百度搜索指数对收视率具有滞后效应,百度搜索指数的增加会对收视率带来明显的带动作用,但长期这种带动作用将会越来越弱。从图2-2可以看出,当给本期网络日增播放量一个正冲击后,收视率在短期有一定的波动,在第二期达到最大的负响应,在第三期达到最大正响应后逐渐收敛。网络日增播放量由于播放平台的不同、刷量等作弊行为的存在,在短期内可能会存在一些结构性的问题,对收视率会产生一定的负面影响,但长期来看还是有比较正面的带动作用。图2-3和2-4分别显示了媒体转载量、正面评论的比例对收视率的影响,总的来看,媒体转载量、正面评论的比例对与收视率的影响模式比较相似,在本期给予一个正冲击后,收视率在短期内有一定波动,第二期有一个正响应,而在第3、4期会有所下降,但从第5期之后则都是正向响应,可见,媒体转载量和正面评论的数量对于收视率的增长具有长期的带动作用。图2-5显示了微博热议度对收视率的影响比较滞后,当本期给予一个正冲击后,初期和第二期的响应为零,第三期呈负响应转而上升,第四期达到最大正响应后下降,第7-10期均为负响应,可见微博热议度对收视率的提升有一个短期的正向影响,但长期来看未必能对收视率有正向提升作用。图2-6显示了微话题的热度对收视率的影响,当在本期给微话题热度一个正冲击后,收视率在短期内会呈现上下波动,收视率在第二期达到正向最大后下降,第五期呈负响应,之后逐渐收敛。这表明在短期内微话题热度增加会对收视率带来明显的带动作用,但长期这种带动作用将会越来越弱。图2-7显示了微信公众号文章数量对于收视率的影响,当给本期微信公众号文章数量一个正向冲击后,收视率呈现上下波动,可见微信公众号文章数量的增长并不一定必然带动收视率的增加。

融媒体环境下视听传播效果评估的指标体系建构——基于VAR模型的大数据计算及分析

6.方差分解分析

方差分解是用方差来评价模型中各内生变量的相对重要性,即衡量每一种结构冲击对其他内生变量的贡献程度。从方差分解的结果来看,滞后1至10期对收视率的变动贡献最大的是其自身因素,但其贡献率从滞后1期的94.17%逐期递减至滞后10期的43.11%,而其他指标对收视率增长的贡献程度则逐期增加。百度搜索指数第2期对收视率的贡献率从第1期的5.83%增长至15.40%,至第10期时,百度搜索指数的贡献率稳定在8%左右,百度搜索指数在短期内对收视率有较大提升,长期贡献较小。网络播放量的贡献率第二期从0增长至6.64%,从第三期开始贡献率稳定在20%以上。媒体转载量和微信公众号文章数量的贡献率则从滞后1期到10期逐渐增长,第10期分别增长至7.52%和11.06%,二者对于收视率的影响比较长期和滞后。正面评论比例和微博热议度对收视率的贡献率则较小,至第10期分别增至3.19%和2.97%。微话题热度的贡献率则是从1期的0增至第2期的4.29%,然后开始回落。可见,正面评论比例、微博热议度和微话题热度对于收视率的增长带动较小。

融媒体环境下视听传播效果评估的指标体系建构——基于VAR模型的大数据计算及分析

(二)基于VAR模型的视听信息传播效果评估指标体系建构

根据VAR模型的分析结果,我们将进入了VAR模型的八个因素作为评估视听信息传播效果的指标,同时为了最后得出的电视剧综合指数能更好地综合反映短期和长期效果,将方差分解中各变量10期的平均贡献度作为各指标的权重,因而,将初始的模型修正如下:

融媒体环境下视听传播效果评估的指标体系建构——基于VAR模型的大数据计算及分析

根据各电视剧在各指标数据上的平均值与权重结合计算得到各电视剧的综合得分,结果如表8所示。总体来说,《那年花开月正圆》的得分最高达到94.8,其次是《人间至味是清欢》,而《血染大青山》、《通天狄仁杰》等剧的传播效果则相对较差。

融媒体环境下视听传播效果评估的指标体系建构——基于VAR模型的大数据计算及分析

结语

本文通过10部电视剧的分天数据,利用VAR模型分析了传统收视率、网络搜索指数、网络日增播放量、媒体转载量、正面评论的比例、微博热议度、微话题热议度、微信公众号文章数量八个变量之间的关系,研究结果表明,所有其他滞后变量对收视率的联合影响是显著的。本文在分析了各指标在时间维度上的关系以及各指标有效性的基础上,通过统计模型客观计算出各指标之间的权重。

本研究也有一些尚待解决的问题。其一,本文建立模型的数据量较小,初始模型中曝光度维度下涉及到的频道、时段、网络播放平台等指标在10部剧中没有较大差异,因而未能纳入分析模型。其二,本文只对电视剧进行了研究,新闻、综艺节目等其他节目类型可能产生影响的指标不一样,影响方式也可能不同,本文的指标体系模型不一定完全适用。其三,从方差分解的结果来看,滞后期的收视率是对收视率影响最大的变量,换言之,虽然其他网络口碑、宣传、搜索行为等指标对收视率也有一定影响。

本文系简写版,参考文献从略,原文刊载于《国际新闻界》2017年第10期。

封面图片来源于网络

(本期执编:小束)

订阅信息

全国各地邮局均可订阅《国际新闻界》,国内邮发代号:82-849,欢迎您订阅!

您也可访问《国际新闻界》官方网站 http://cjjc.ruc.edu.cn/ ,免费获取往期pdf版本。

此外,编辑部还存有少量过刊,您若需要,可微信私信我们或发邮件至 gjxwj0@126.com 与我们联系哦!

后台-插件-广告管理-内容页尾部广告(手机)
标签:

评论留言

我要留言

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。