6月19日,以“对话主角”为主题的第六届中国广告趋势论坛在上海举行,凤凰网作为论坛协办方,对活动进行全程报道,以下为复旦大学新闻学院广告学系主任程士安教授以《微博意见领袖影响力研究》为题的演讲实录。
各位好,今天的30分钟和在座的新老朋友分享一下关于对微博意见领袖影响力的研究,现在是以数字媒体作为一个平台来做营销策略的时候,比较火的就是以微博作为平台来做品牌、产品、销售,现在很多公司专门经营做微博这个平台上的所有信息,在微博为平台经营做品牌的信息、销售的信息等等一系列其它信息的时候,我们怎么样让品牌在微博所有相关粉丝当中起到一定的影响力,关于影响力的测评就说我们通常原来说对报纸、电视、广播发行率、收视率一样的意思,所以我今天跟大家分享的是,以传统媒体官方微博为例,来看微博上意见领袖影响力究竟如何来评判。微博在整个网络舆论的走向中是独树一帜的平台。如何来测评,去年我们找了中国社会发生的典型事情,就是广州的小悦悦事件,为什么选择这个事件?因为这个事件在社会上引起的轰动效应是比较大,而且关注的人群很多,各种各样的观点也不一样,时间延续得很短,一直到小悦悦去世之后,整个事件高峰往下跌。所以我们选择了这样一个案例,可能对这个研究过程当中,既能发现一定的规律,但是时间也比较短,做起来比较好做。
当时的研究方法是基于这个平台上的数据来做解释的,在整个过程当中,我们讨论分析的路径是意见领袖这样一个概念,在微博平台上和官方的意见领袖、草根的意见领袖,他们在平台上的关系,究竟是谁在推动着舆论发展。这个图是各种意见领袖的话题传播及延伸的重要环节,就是我们说微博平台上是一波一波的信息迭起,实际上可以这样理解,在所有的包括新浪、腾讯所有微博平台,我们做信息传播的时候,第一个峰值和第二个峰值过后,实际上第三个峰值是相对进入到一个低谷。我们如何来逮住第一、第二个峰值做一些分析。
整个的研究过程很清楚,我们是从2011年的10月13日一直到10月24日,这一段时间对所有的数据进行分析。这个数据的来源是新浪的数据库,想跟大家说的是,整个研究得到第三方公司的支持下,我们拿到的新浪微博较为干净的数据库。
当时的截取量是选择了微博两千多条,媒体用户是575个,为什么要从这么多的数据当中清洗出来这些?截取的媒体分类很清楚,一个是中央类的党报、都市报和专业类,还有日报。关于深度报告、综合报道、专业报道我们就根据这些来进行分类。从新浪的微博用户粉丝超过五千个有影响力的用户当中,我们清洗出来的数据是达到18万,共同抓取了9739个媒体相关的官方微博以此作为主要的研究对象。在整个的基础分析当中,这是我们的思想逻辑,一个是事件垂直的数据分析,垂直分析看它的粉丝分布和地域分布,第二个就是数据的垂直分析我们看官方媒体的新闻官、记者、编辑,我们称之为媒体人在平台上发表的意见,他们的粉丝量还有这些帐号的地域分布。通过技术分析还发现,事件收据的垂直分析当中,官方媒体的记者粉丝量的排序和记者粉丝量被转发的排序以及记者的微博被评论的排序,因为粉丝量和微博的被转播和被评论都是我们将来下面要考量的指标,这是我们拿到了通过时代嘉道给我们的清洗数据之后做出的分析。
这张图可以看出来,官方媒体、报纸、媒体、杂志的粉丝的分布就是地域性的分布,这是我们官方媒体粉丝量排行前20名的数据。这是先把垂直数据理清,第二个是官方微博的地域分布。在关于小悦悦事件中,这个信息波及到的官方媒体的地域性分布。还有一个非常重要的就是官方媒体的新闻官、新闻记者和编辑的粉丝量分布,我们是以万为计量单位来看分布的排序。
我们再根据记者帐号的地域进行分析,通过这些分析就很清楚,对于广州的小悦悦事件,关注度比较高的媒体究竟聚集在哪里,就一目了然。这是刚才所说的关于前20位的人群,比如说新民周刊的杨江就排第四,还有被转发、被评论。
第二部分给大家看的就是我们根据要求,把清洗出来的数据做的一些基础分析,这是基础分析的七个环节。这是我们要做研究的第一步,第二步就是研究它的影响力测评,我们说究竟是粉丝多,影响力大,还是被评论影响力大,还是被转发影响力大,现在在学术界包括很多的研究公司和研究机构,也都在对微博意见领袖影响力测评的因子进行讨论。这里面我们认为测评的考量因子主要是意见聚合粉丝的数量,意见被粉丝的转发量,意见被粉丝的评论量,这里有一个很有意思的事情,这里面涉及到一个广度、深度和话题在什么时候被消解,第三个点就是说第二层级传播是否在事件高潮被消解的终结端,找到事件被消解的终端在哪里,是话题消解的点在哪里,所以这上面都是一系列的变量,我们要研究的是这一系列变量之间的相互关系。所以着重讨论的是,探讨着影响力测评因子的特定含义和它的权重。所以关于这个权重一直是我们研究过程当中的一个重要思考点。
刚才讲的是我们垂直数据以后如何看相互关系的因子相互比重在哪里,这是一个事件回放,也就是第三方数据公司根据我们的要求重新把数据库里所有的信息拿来以后,我们把它清理之后,从10月13号一直到24号,全部整理出来了,这就是在微博上话题的延伸。因为你要看我这个企业,我这个品牌在整个微博上的过程,必须要先把话题理清。这就是我们做出来的事件信息的树状图,分了几个板块,这个是新浪微博所有用户对小悦悦事件的事件梳理,这个是新浪微博的传统媒体,这个是所有用户媒体对它的梳理,这个是新浪微博上的传统媒体对小悦悦事件发表的话题的分化,注意这边用红颜色的字标出来的,就是说在什么峰值上,在什么话题的峰值上它被分化掉了。接下来我们要研究在这个话题被分化、分解的过程中,传统媒体的官方微博新闻官、记者和编辑在这里面起到了哪些作用。
下面给大家看一下还是按照时间节点发生的小悦悦被碾事件,肇事者,检察院开始介入,伤情的通报,小悦悦最后离世所有这些都可以在数据库里清晰地看到,新浪微博传统媒体对这个事件的影响力会延伸到哪里,所以这个图表是所有的媒体在这边的排序。做完这个之后,我们省略给大家介绍的是按照事件发生的过程当中,微博粉丝的排序等等。我们选择了当中一部分给大家看,接下来就是我们探讨微博影响力的分析模型的大致模型,这里我们提出了三个非常重要的一点,一是他们是如何推动舆论的,他们如何形成观点的,他们如何引发关注的,最终目的是我们要提炼出一个能够推动舆论往前发展的核心推动力究竟在哪里。因为微博上不是看热闹,而是看这个舆论的走向究竟按照什么样的规律。我们就根据微博影响力梳理了三个维度,活跃度、覆盖率、传播度,共同构成了微博的影响力。所谓活跃度是指用户在微博平台活跃度和其它帐号之间的关联关系。比如说覆盖率是指粉丝的活跃度、分布面以及一级粉丝、二级粉丝的人群规模,所谓的一级、二级粉丝,不用解释大家都明白的。这三个维度后面的那些具体指标共同构成了这样一个微博影响力的评判基本框架。
微博影响力的三个维度我们又继续考量它的指标细化,怎么样来看它的活跃度,怎么样看它的传播度,以及它的覆盖率,譬如说这里面的活跃度平均每天发表的微博数,就是平均每天发多少,第二是原创和转发的比例系数,第二是讲传播度,平均每天微博被转发次数,以及平均每天他的微博被评论的次数,那么接下来的覆盖率,我们讨论了三个细化的指标,一是活跃粉丝数,二级传播数我们再进行考量的。这是我给大家介绍一下我们三个维度考量指标的解析,比如说活跃系数、传播系数和覆盖系数,比如说1、2、3,如何来对1的系数进行解释的。这当中涵盖着发布的时间、发布微博的总数、粉丝数、被转发量等等。覆盖量里面还谈到了第三点关于覆盖系数的问题,研究了它的活粉数和二级传播系数以及粉丝的传播参数,这些已经通过大量的数据来验证三个考量系数的关系。
今天由于时间关系,我们无法跟大家讲,微博影响力三个维度的计算模型的雏形,我们要通过一定的算法把它算出这个维度究竟会影响到哪里。比如说底下我们可以看,关于解读模型当中系数均为动态系数,因为这个系数是每天在变化的,在日常观测中应为系统不断根据数据变化自学习调整,实时跟踪账户。我们可以放在微博平台上跟进任何一个品牌,任何一个企业,甚至于跟进任何一个政府的官方微博来看它的微博在整个社会影响力当中不断变动的影响力数据。计算模型的雏形当中,我们算法的依据是我们用的系统自学习决策过程的原理,第二是我们用的系统稳定的统计学标准来对上面三个大的指标下面有7个细的指标的实时滚动数据,如何来通过一种计算公式得到影响力的问题。小悦悦事件研究当中的简化模型,最后我们作为研究探索,把模型简化成底下这一条,就是影响力是平均微博数,包括每条的被转发数被评论数以及它的粉丝,有三个系数,这三个系数我前面讲的是我们计算出来以后再回过头来套在这样一个框架下理解的。
第四步进入应用模糊集决策分析方法来进行建模,后来模型也已经建立出来了,运用模糊集的决策分析来建模,比较麻烦的是如何确立各种指标的权重,我们导进去很多的方法、数据来验证我们权重数据的多寡,最后得出来后边的三个,活跃系数是0.4、0.5、0.1,这个过程将来有兴趣的话,我们可以和大家再深入地交谈。于是我们就取得应该获得时间叙述当中的,然后这里取转发数的均值,形成这样一个波度出来的,这就是根据我们的公式和方法,对整体事件当中的2190条传统媒体的微博进行做排名,可以说是一目了然的。
最后一条规划后的影响力计算,表格的右边规划后,所谓的规划成算法,算法得出来的结论影响力的排序,应该说迄今为止这个算法还是相对很科学的,因为在做研究的过程中,我们是和复旦大学计算机学院这个专业领域当中的一些专家、教授共同来讨论影响力的计算方法的。这就是过程了,后面是解释,底下反过来我们做好这个模型以后,用这个模型来对单个话题进行检验,这是对陈贤妹话题的检验,这是检验结果。后面的数字都是我们话题排序比较。最后我们对传播度的六个话题的传播分析得出这样一个情况,给大家简单过一下。
接下来对微博的文本进行分析,这个就是我们传统的文本分析方法,但是我们也是运用在微博这个平台上来看的,所以你看包括上海的新闻晨报的话题的覆盖,包括文本比对的分析发现等等,所有这些都是我们所做的研究。
这里给大家做了一个现在的小结,这次研究提出了关于微博影响力的测评方式,为什么今天在这个论坛上跟大家分享这个过程?因为我们说社交媒体已经进入了我们的视野,无论是对商业传播、政治传播来说,它是一个非常重要的平台,也就是说对这个平台我们怎么样来看它究竟有多大的作用。所以我带着研究团队和博士生、研究生年轻老师在做这个研究的时候,这个规律是放之四海而皆准的,我们对商业传播、政治传播任何问题都是用这样的问题来考虑的,比如说315的麦当劳事件同样可以用这个方法来检测,谁在整个微博平台上起到了非常重要的作用。这是在当下,刚才上一个话题的时候,我们讨论到电视台的未来的发展趋势,比如说讲到了收视率的问题,最近我们对传统媒体进行了一些研究,我们调查发现实际上做电视媒体的人就考虑到五年、十年后我们的出路在哪里,特别是做新闻节目的人。我们调查发现90后看新闻,获取新闻的途径最大的是通过腾讯QQ的弹出窗口来获取新闻的。比如说去年的312日本大地震在第一时间是通过腾讯的QQ弹出窗口来把这个新闻推给我们的受众。所以按照传统媒体的电台、电视台,包括像新媒体,现在社交媒体上的微博,现在要放在一个全媒体的环境下来解读他们的内容和影响力,基于这样的前提,去年夏天我们对腾讯、微博的弹出窗口,我们称之为平台、媒体也好,一定要做一个深入的研究,才能给到一个考量标准,给出考量标准的最终目的是我们将来无论是在国家的大体方针,还是站在一个品牌的角度来说,用什么样的媒体策略,才能有效地把信息送达消费者和送达目标受众。今年通过对去年秋冬广州的小悦悦事件找到了微博的一些影响力基本规律,现在已经把这个模型建好了,这个模型的建设之后,它的作用是很大的,我们可以跟进任何一个事件来及时地,所谓及时就是分分钟可以知道这个事件的走向,下一步在哪里。说实话因为我们在复旦新闻学院对下一步所有的新闻影响力,所有的重大事件影响力将做的是实时跟进的及时分析,来给任何一个信息的发布者或者信息的主导方给到一个解释。非常感谢大家的聆听,谢谢。