理论篇
第一章 信息可以像病毒一样扩散吗?
“思想、产品、信息和行为像病毒一样传播。”
马尔科姆 格拉德威尔(Gladwell,2000)
数字媒介的发展常常给人一种错觉:信息可以像病毒一样扩散到每一个人。信息扩散是随着时间的推移通过某些渠道在社会系统成员之间发生的信息传播。个体通过信息扩散了解外部世界,并对他人产生影响。作为一种基本的传播现象,信息扩散对社会生活有着广泛的影响,如新闻消费(Funkhouser and McCombs,1971;Greenberg,1964a,1964b;Larsen and Hill,1954;Miller,1945)、购买行为、找工作(Granovetter,1973)、集体行动和政治参与。交通网络(尤其是航空网络)成为病毒在全球扩散的主要通道。越来越多的人认为在线社交网络也具有这种神奇的魔力。
本书致力于反驳这种观点。虽然重大的事件可以迅速扩散到绝大多数人,但绝大多数信息并不能成功地扩散出去。本书所有内容主要围绕信息扩散的有限性这一困惑展开。分析抑制信息扩散的瓶颈对于理解网络信息扩散具有更重要的价值。接下来,本章将首先简要介绍网络信息扩散的研究背景并提出一个核心困惑;然后介绍本书的研究目标并提出操作化的研究问题;接下来介绍本书的基本路径;*后简略勾勒本书潜在的理论价值。
第一节 信息共享网站的兴起
随着社交网络和信息聚合服务的兴起,信息共享网站成为互联网上信息传播的新平台。本书将信息共享网站定义为社交媒体当中的一种类型。用户可以在信息共享网站上提交、分享和评论信息。信息与通信技术的演变以及与公众之间的互动,改变了信息扩散的基本机制,这对传播研究具有重要意义。从技术上讲,信息共享网站基于社交网络服务和信息聚合工具,推动信息扩散由大众传播向用户参与过程转变。信息共享网站允许人们通过社交网络传播他们的人际作用。信息共享网站通过人际网络以及其他信息渠道帮助用户快速找到需要的信息(Chowdhury and Landoni,2006),基于信息聚合功能为用户提供流行信息的排行榜(例如新浪微博热搜、推特热门话题)。
自传播学研究肇始,扩散研究就成为一个重要的研究领域(Miller,1945)。产生了丰富的理论脉络和多种理论观点,其中既包括大量的实证研究理论,也有很多经典的分析模型,例如两级传播理论(Katz,1957;Katz and Lazarsfeld,1955)、新闻扩散理论(Greenberg,1964b;Larsen and Hill,1954;Miller,1945)、创新扩散理论(Rogers,1983)、门槛模型(Granovetter,1978;Granovetter and Soong,1983,1986,1988;Valente,1993,1995,1996)、巴斯扩散模型(Bass,1969,2004)、传染病模型(Anderson and May,1992)。
迄今为止,信息扩散已经发展成为社交媒体研究的核心问题之一。它吸引了许多来自不同学科的学者,致力于揭示网络信息扩散中隐藏的人类传播模式和扩散机制。其中*重要的一种扩散机制就是基于社交网络的人际作用。早期的新闻扩散研究受限于数据质量等问题,到了20世纪八九十年代开始走向衰落。互联网的发展复兴了聚焦于扩散机制的扩散研究。除了人际作用之外,还有很多其他影响因素在信息扩散当中发挥着重要作用,如外生影响、个体属性、内容特征以及不同信息之间的关系。识别这些信息扩散的驱动力对理解扩散具有重要的意义。
第二节 一个重要困惑
本书源于一个关于信息扩散的重要困惑:信息可以像病毒一样扩散吗?基于复杂网络(特别是无标度网络)的传染病模型表明信息可以感染系统当中相当大比例的个体(Pastor-Satorras and Vespignani,2001)。具体而言,研究者发现如果网络节点的度(即邻居数量)为长尾分布,传染病模型的门槛就会消失或作用变得非常有限。据此,研究者认为互联网上的信息扩散也可形成全局性的扩散(Pastor-Satorras and Vespignani,2001)。全局性的信息扩散可以“感染”网络当中相当一部分用户。全局性信息扩散的存在表明,在一个很大但有限数量的节点构成的网络当中,超过一个固定比例的节点已经被激活并传递信息。相关的研究进一步鼓励了这种将信息看作病毒的观点。然而,信息真的可以像病毒一样扩散吗?
瓦茨根据分析模型和数值模拟提出,全局信息扩散是复杂系统的一种罕见而脆弱的特性。“一个系统可能会长时间保持稳定,并承受很多外部冲击,然后突然出现一个明显的大型级联”(Watts,2002)。在另一项研究中,瓦茨等提出大型级联或全局性信息扩散的影响力不是由“有影响力”的人驱动的,而是由一定数量易受影响的个体驱动的(Watts and Dodds,2007)。因此,理论模型与社会现实之间存在着张力,但是缺乏实证数据的支撑,分析模型和数值模拟无法终结已有的争论。
为了采用实证研究回答为什么一些热门歌曲比普通歌曲更成功,马修 萨尔加尼克(Matthew Salganik)等设计了名为“音乐实验室”的研究项目,通过构造一个人造的音乐市场来观察14 341名实验参与者如何下载音乐。他们发现音乐的质量只是影响它成功的部分因素,当系统中的社会影响(social influence)增加时会带来更大的不平等,同时也会使得音乐的成功变得更加难以预测(Salganik et al.,2006)。因此,要预测哪些信息可以实现病毒式传播相当困难。这再次表明全局级联是复杂系统当中一个很脆弱的现象(Watts,2002)。但是,“音乐实验室”研究项目中的社会影响其实不是对人际作用的直接测量,而是一种基于协同过滤和信息聚合功能的“群体把关”(关于“群体把关”内容的介绍参见本书第五章)。
在现实世界中,大规模的信息扩散虽然存在,但却是罕见且难以预测的。针对全局性信息扩散这一议题,研究者不断发现扩散规模是有限的(Bakshy et al.,2011;Lermanand Ghosh,2010;Leskovec et al.,2006;Sun et al.,2009)。扩散规模的分布通常是一个长尾甚至是无标度的,在双对数坐标系中表现为一条斜率为负值的直线。换句话说,绝大多数信息无法在在线社交网络中达到全局扩散。
信息如何扩散以及如何进行病毒式传播的问题已经引起许多学科的关注,比如传播学(Fu,2012)、市场营销学(Aral et al.,2009;Aral and Walker,2011;Berger and Milkman,2012)、计算机科学(Lerman and Ghosh,2010;Lou and Tang,2013;Steeg et al.,2011;Wu et al,2011)和网络科学(Borge-Holthoefer et al.,2013;Ugander et al.,2012)。然而研究者对于什么决定了信息扩散的成功仍然不清楚(Weng et al.,2013)。大多数扩散模型是基于简单传染(simple contagion)或复杂传染(complex contagion)的假设而构建的。多数研究认为信息传播是简单传染,它假设信息像疾病一样传播,每一次接触都有相同的概率感染一个人,并采用传染病模型进行解释(Pastor-Satorras and Vespignani,2001)。然而,也有研究显示疾病和信息以不同的方式传播。比如复杂传染的观点认为重复曝光可以增加传播的可能性,因而更适合于解释在线信息传播现象(Centola,2010;Romero et al.,2011)。
综上所述,我们对于信息扩散规模的理解仍然非常有限。尽管研究者在过去十年对扩散研究的兴趣日益浓厚,但信息扩散研究似乎被未被消化的事实所阻塞。为什么有的信息可以迅速传遍全网,绝大多数信息却无法传播出去?我们仍然不知道是什么导致了极少数的全局信息扩散(全局级联),也不知道是什么限制了绝大多数信息的扩散。笔者认为仅仅将原因归为人们对信息不感兴趣是远远不够的。因此,分析限制信息扩散的瓶颈成了一个重要而具体的研究问题。
第三节 问题、路径和意义
为了回答网络信息扩散的规模有限性困惑,有必要研究一些有代表性的信息共享网站上的信息扩散,尤其是分析扩散规模与扩散机制之间的关系。需要指出的是,本书主要从研究困惑的角度切入,围绕这一个研究困惑提出操作化的研究问题。以下研究问题是对研究困惑的细化和已有研究的高度浓缩,主要起到提纲挈领的作用,粗略描摹出本书思考的大致方向。在此基础上,以后各章将对已有的文献进行梳理,建立本书的理论框架。然后,结合具体的实证研究对象,提出操作化的研究假设,并结合具体的实证数据对假设进行检验。
一、核心问题
第一,对网络传染病模型的信心建立在一个有力的假设之上,即人与人之间的相互影响可以使得传染病感染众多人(Pastor-Satorras and Vespignani,2001)。本书的出发点,也主要关注这种人际作用对信息扩散的影响。人际作用被定义为人际关系对信息接触和分享的影响。研究目的是评估一个人的信息分享行为在多大程度上受到其在线社交网络中朋友的影响,尤其是重复曝光的作用。重复曝光即对同一信息的多次接触,因此被宽泛地定义为社会强化(social reinforcement)。它有助于改变个体对于信息的态度,并增加信息分享的概率,在创新扩散研究(Valente,1993)、在线健康行为传播的研究(Centola,2010)和推特上的信息扩散研究(Weng et al.,2013)中被广泛使用。
为了量化信息扩散中的人际作用,本书采用格兰诺维特所提出来的门槛模型作为主要理论视角(Granovetter,1978;Granovetter and Soong,1983,1986,1988)。使用网络门槛来量化人际作用的好处在于它能够捕捉重复接触信息的社会强化效果。分析网络门槛与信息扩散规模之间的关系可以检验复杂传染的假设(即重复曝光有助于信息扩散)。
除了研究人际作用的社会强化效果之外,本书还分析了人际作用的非线性特征。在扩散研究文献中,J形曲线模型是第一个解释人际作用非线性特点的模型(Greenberg,1964b)。在信息扩散研究中,格林伯格发现扩散规模与人际作用之间存在非线性关系,并将其归因于信息的重要性。一般而言,重要信息的流行度或扩散规模大,而不重要信息的流行度或扩散规模小。也就意味着人际作用对扩散规模的影响机制依赖于扩散规模本身的大小。与J形曲线模型类似,Onnela和Reed-Tsochas对脸书(Facebook)应用程序的扩散研究表明,有两种不同的社会影响机制(Onnela and Reed-Tsochas,2010)。具体来说,只有当脸书应用程序的流行度超过一个特定阈值之后,社会影响力才对脸书应用程序的扩散起作用;如果这些脸书应用程序的受欢迎程度停留在这个阈值之下,社会影响的作用就消失了。在网络信息扩散当中是否同样存在人际作用的这两种影响机制也是一个很重要的问题。基于上述思考,提出第一个操作化的研究问题:
RQ1:人际作用如何影响信息共享网站上的信息扩散?
第二,信息技术改变人类传播的基本方式,进而改变了人们的日常生活。社交网络服务和信息聚合功能在信息传播中变得越来越重要。它们的影响不仅仅是技术上的,更重要的是信息扩散机制的社会影响。不仅人类个体之间存在互动,人类和信息系统之间也存在互相影响。第一个研究问题RQ1主要关注人际作用,它建立在信息共享网站的社交网络服务的基础上。除此之外,信息聚合在信息扩散中也扮演着重要的角色(Lerman and Ghosh,2010)。例如,在推特上流行的推文被
展开