搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
出版时间 :
无库存
在线社会网络的用户行为建模与分析
0.00     定价 ¥ 159.00
泸西县图书馆
此书还可采购1本,持证读者免费借回家
  • ISBN:
    9787030526670
  • 作      者:
    郭强,刘建国
  • 出 版 社 :
    科学出版社
  • 出版日期:
    2017-05-01
收藏
荐购
精彩书摘
第1章 在线社会系统
  1.1 在线社会网络
  在线社会网络(online social network,OSN),是一个可以在一定程度上延伸现实生活关系的平台,人们可以在这个平台上分享兴趣爱好、活动。它*早出现在2003年的美国,进而风行全世界。市场研究机构eMarketer在2013年11月公布的数据显示,全世界约有16.1亿人每个月至少使用一次在线社会网络。其中,全球*大的社交网站Facebook在全球活跃用户的普及率可以达到51%。预计到2017年,各社交网站(Twitter、Facebook、MySpace、Friendster、Google+等)的总用户数将超过23.33亿。此组数据显示,2013年全世界有22.8%的人每月至少使用一次社交网络。而到2017年,全球人口总数预计会超过74亿,届时全球将会有超过30%的人使用在线社会网络。
  随着Web2.0的迅速发展,在线社会网络越来越受到人们的广泛关注,人们的生活、交流以及获取信息的方式也发生了巨大的变化。尤其是近几年微博、微信等社交工具的迅速崛起,即时通信工具、社交网站等在线社会网络已经成为人们不可或缺的沟通工具。随着网络化进程的加快,人们越来越倾向于把日常生活转移到网络上来。与现实世界相比,在线社会网络的沟通不受时间和空间的限制,用户与他们的家人、朋友、同事,甚至陌生人都可以随时随地保持联系。如今信息的更新越来越及时,也越来越高效和便捷,这使得人们可以随时随地将自己的所见所闻发布到网上,虚拟社交与现实世界之间的交叉性越来越强[1]。
  近年来,微博和博客成为人们发布新闻、获取信息、分享感受的主要平台之一。在线社会网络在信息传达上的及时、高效和便捷等特性,使其在社会生活、政治、疾病预防等方面发挥了极大的作用。例如,2011年8月,美国弗吉尼亚州发生地震后,在传统媒体报道这一突发事件前,大量消息已经在Facebook、Twitter等社交网站上广为传播,这显示了新型媒体在信息传播速度方面的优势。与此同时,社交网络的发展也引起了一系列的疑问,如新型社交网站的整体结构如何?这些网站在提供给用户更便捷、更低成本的交互服务的同时,是否提高了人们的社交能力,是否能够超越人类大脑皮层的能力限制?抑或是与计算器相类似,仅仅提高了简单计算的速度,并没有提高人类对于数学的认知能力,当今的数字网络是否也仅仅是降低了人们互相沟通与联系的成本,并没有提高社交能力的生理限制?
  互联网的不断发展使网络上的服务越来越贴近人们的生活,人们的生活也变得更便捷和低成本。与传统媒介相比,在线社会网络信息更新的及时、高效和便捷等特性,使其在信息发布、意见收集、信息交流、突发事件预测、预防疾病传播、事件定位、寻找新兴话题和广告营销等诸多方面起着举足轻重的作用。但与此同时,网络上也存在着流言肆虐、隐私泄露等问题,这严重影响人们的正常生活。如何正确利用在线社会网络的优势来规避风险成为在线社会网络研究的重要目标之一。而对社交网络的拓扑结构和用户的行为模式的研究可以让我们更深入地认识用户的行为与心理状态。此外,对人类朋友圈上限值的研究也具有重要的理论价值和现实意义。
  作为在线社会网络*重要的两种形式,微博和Facebook等社交网络服务(SNS)网站对于人们的生活、工作尤其重要。而由于其固有的特性,微博和Facebook侧重于人们生活的不同方面,微博注重信息的传播,Facebook则注重朋友间的交互,所以可以将微博看做获取信息的平台,而将Facebook看做交友的平台。
  1.1.1 社交网络中的基本概念
  社交网络是由一个或多个行动者和他们之间的一种或多种关系组成。而在线社会网络,是指人和人之间通过朋友、血缘、兴趣、爱好等关系建立起来的社交网络平台,包括Facebook、Twitter、MySpace、人人网、开心网等。根据哈佛大学心理学教授Milgram在1967年创立的六度分隔理论,即“你和任何一个陌生人之间所间隔的人不会超过六个”,也就是说,*多通过六个人你就能够认识任何一个陌生人。按照六度分隔理论,以认识朋友的朋友为基础,可以不断扩大自己的交际圈,*终整个社会形成一个巨大的网络。这种基于社会网络关系思想的网站就是在线社会网络。这种网络平台致力于其用户关系的建立和维护。在网络中,用户可将个人信息展示在“个人主页”上,内容包括文字、图片以及视频等,其他用户可浏览该用户的信息,同时该用户也可以浏览其他用户的信息,用户之间还可以通过评论、提及、转发等功能实现交流互动以及信息共享。与其他大多数网站不同,在线社会网络的内容都是用户自己生成的。众多的在线社会网站只是为用户提供服务的一个平台。比较著名的某些社交网站如图1-1所示。
  图1-1 比较著名的社交网站
  目前关于社交网络还没有统一的定义,本书在已有研究的基础上,尝试给出社交网络的描述性定义。社交网络是一个有边界的系统,其中:①系统的主体是公开或半公开个人信息的用户;②用户能创建和维护与其他用户之间的朋友关系及个人发布的内容信息,如日志、照片等;③用户通过链接可以浏览其他用户的主页和分享的信息,并进行转发和评论。
  一般来讲,社交网络具有几个基础性的关键概念,包括行动者、关系、二元图、三元图、群等。
  (1) 行动者。行动者是指组成社交网络的社会实体,包括团体中的个人、企业的部门、城市服务机构或世界体系中的民族、国家。在网络分析中,每个社会实体都可以被刻画成一个节点。
  (2) 关系。关系是指行动者之间的联系。行动者通过社会联系彼此连接,联系的范围和类型非常广泛,而其特征就是建立了一对行动者之间的连接,如甲对乙进行评价、共同参加一项活动、上级对下级的领导等。在网络分析中,每对行动者之间的联系通常被刻画成两个节点之间的连边,而联系的强弱则通过边的权重来表示。
  (3) 二元图。在*基础的层次,一个连接或关系建立了两个行动者之间的联系。这个联系在本质上是从属于这两个行动者的,而不是仅仅从属于某一个行动者。二元是由一对行动者和他们之间的联系构成。二元分析关注成对关系的属性,注意联系是否互惠,多重关系的某些类型是否同时出现等。
  (4) 三元图。许多社交网络的分析方法和分析模型关注的是三元图——三个行动者子集和他们之间的联系。其中*受大家关注的是三元图是否可传递(例如,若行动者a喜欢行动者b,行动者b喜欢行动者c,是否行动者a也喜欢行动者c)和是否是平衡的(例如,若行动者a和b彼此喜欢,则他们对第三个行动者c的态度是相似的,而若行动者a和b相互不喜欢,则他们对第三个行动者c的态度是不同的)。
  (5) 群。二元图是成对的行动者及其联系,三元图是三个一组的行动者及其联系,则行动者群可定义为任意集合的行动者和他们之间的联系。
  1.1.2 社交网络的理论基础
  六度分隔理论,也称“小世界”理论,具有高集聚系数和短平均路径的特性。如前所述,社交网络理论来源于六度分隔理论,即任意两个人之间可以通过不多于六个中间人而建立联系。它要表达的观点为,任何两个素不相识的人都可以通过一定的渠道产生必然联系,完全没有关系的两个人是不存在的。
  这个理论*早是由美国著名社会心理学家Milgram于20世纪60年代提出的。后来,Milgram设计的信件传递实验证明了这一理论的正确性,随机发送的160个信件大多都在经过五、六个步骤后到达了目标人手里。
  强连接和弱连接。六度分隔理论肯定了人们之间联系的普遍性,但没有区别这种联系的关系强弱。人们会在生活中认识数以百计的人,其中既有经常联系的亲密的亲人、同事、朋友,也有对于我们无足轻重的只是认识的人。人们和不同的人的联系方法和强度是不同的,而六度分隔理论却将这些联系看做无差别的,没有强弱之分。因而在实际运用中,对连接强度进行加权有时是很必要的。
  贝肯数。贝肯数是由六度分隔理论演变而来的。贝肯只是一个普通演员,在电影中从来都不是主角,但是他在很多电影中与众多影视明星合作过,人们将当时贝肯要与其他影视明星之间产生连接所需要的中间人数量称为贝肯数。这一数字说明,一个人要成为网络的中心,他不一定非要成为一个大人物,一个经常出现的小人物也可以非常接近网络中心。
  邓巴数。邓巴数(Dunbar number)[2]是英国牛津大学人类学家邓巴于1992年提出的,指的是可以和特定人物保持亲密关系的*多人数,一般范围为100~230,通常人们使用150。邓巴数也称“150定律”,即一个社群能够保持稳定联系的规模大约为150人,超过这个数,人们相互间的互动和影响会迅速降低,这是由人的大脑皮层容量决定的。此处限定的人际关系是指某个人知道其他人是谁并且了解那些人之间的关系。支持者认为,人数多于邓巴数的团队,需要更加苛刻的法律、规章、制度来保持其稳定性和凝聚力。
  动物学家通过对灵长类动物的研究发现,社群规模大小受到其大脑皮层容量的限制,即大脑皮层容量的大小限制了其能维持稳定联系的人数的上限。动物学家认为在一个特定物种与其社群规模大小之间存在一个系数,而该系数可由该物种的大脑皮层容量大小来计算。
  1992,牛津大学人类学家邓巴根据从灵长类动物界观测到的相关系数来预测人类社群的大小,从而提出了邓巴数理论,即“150定律”,意味着人类社群规模一般为150人左右,这是一个人类个体能够和其他人维持稳定联系的理论上的上限值。一个人类社群规模一旦超过这个数字,群组内成员就不能进行有效的沟通和协调,社群结构会变得松散。
  1992年,邓巴开始研究英国人寄圣诞卡的习惯。在邓巴作研究的那个年代,社交网络尚未诞生,他希望找到一个办法衡量人们的社交关系。邓巴不仅想知道研究对象认识的人数,更对每个个体真正在乎的人数感兴趣。他发现,可以通过研究圣诞贺卡来探寻这种情感关联。要送出贺卡,前提是你*先必须知道收贺卡人的邮寄地址,然后去买贺卡、买邮票,再写上几句祝福的话,*后寄出去。这一系列活动都属于一种投资,需要人花费时间、金钱来完成,而大多数人是不会愿意为一个无关紧要的人这样费心费力的。
  邓巴研究发现,人们把约25%的贺卡寄给了自己的亲人,近67%寄给了朋友,约8%寄给了同事。不过,其中*重要的研究发现是这样的一个数字:对于一个人寄出的全部贺卡,收到贺卡的家庭的人数之和的平均数为153.5人,即150人左右,这一数字与邓巴数理论非常吻合。
  在邓巴看来,其原因很简单,人不能超出生理条件的限制而实现无限的可能,例如,人不能在地球上像鸟儿一样飞翔,五秒内跳不了一百下,人耳听不到频率低于20Hz的次声波和超过20000 Hz的超声波。大多数人*多只能与150左右的人建立具有实际意义的联系,不同个体之间可能会有所不同,但不会比150多出太多。然而,这一规律也不完全绝对,因为既有不善交际、内向自闭的人,也有善于交际、开朗的公众人物。但总体来讲,一个群体的规模一旦超过150人,成员内部之间的关系就会开始淡化。尽管现在的文明程度较以前有了很大的提高,但人类的社交能力并没有获得大的提升。邓巴说道:“150个人似乎是我们能够建立稳定社交关系人数的上限,而在这种社交关系中,我们不仅仅是了解他们是谁,而且也了解他们与我们自己之间的关系。”
  根据邓巴的研究,人类的社会结构表现为图1-2所示的同心圆模型:5人左右的亲密接触圈;12~15人的同情圈,在此范围内若有人去世,其他人会非常悲伤;50人左右组成群落,共同生产、活动;150人左右称为氏族,他们可能具有相同的信仰或习俗;500人左右组成部落,他们使用相同的语言(这里的“语言”只指一些经常交流的人之间约定俗成的词语和概念);5000人左右为大群落,他们通常具备共同文化。参照此模型,当交际范围超过150人时,个体之间的交流、影响就会明显降低,只能靠共同的语言来维系;而当人数上升到5000人左右时,维系此社会结构则只能依靠共同的文化。
展开
目录
目录
前言
第1章 在线社会系统 1
1.1 在线社会网络 1
1.1.1 社交网络中的基本概念 2
1.1.2 社交网络的理论基础 3
1.1.3 社交网络的国内外发展状况 6
1.1.4 社交网络的优势和劣势 7
1.2 个性化**系统的蓬勃发展 8
1.2.1 产生背景 8
1.2.2 个性化**系统的应用发展 10
1.2.3 研究意义 19
参考文献 22
第2章 超网络模型的构建及其应用 25
2.1 超网络相关研究 25
2.1.1 超网络的基本概念 25
2.1.2 超网络的研究概述 25
2.1.3 超网络研究存在的问题 27
2.2 知识传播相关研究 28
2.2.1 知识的基本概念 28
2.2.2 知识传播的研究概述 31
2.2.3 知识传播研究存在的问题 32
2.3 科研合作超网络模型的建立与分析 32
2.3.1 已有的两种超网络演化模型 32
2.3.2 LWH超网络模型的建立 35
2.3.3 LWH超网络拓扑特性的分析 36
2.4 科研合作超网络上的知识传播研究 44
2.4.1 知识传播模型 44
2.4.2 知识传播模型的参数设置及评价指标 47
2.4.3 结果分析 48
2.5 科研合作超网络上的知识创造研究 51
2.5.1 知识创造超网络模型的建立 52
2.5.2 数值模拟 55
2.6 小结 59
参考文献 60
第3章 用户行为模式分析 65
3.1 用户行为在个性化**算法中的重要地位 65
3.2 用户行为模式分析 65
3.2.1 基于集聚系数的度量方法 66
3.2.2 基于信息熵度量用户兴趣的多样性 70
3.2.3 在线打分的记忆效应 75
3.3 微博中基于用户结构的信息传播分析 81
3.3.1 微博网络的相关机制 81
3.3.2 突发事件的信息传播分析 82
3.4 Facebook中个人中心网络的统计特性分析 87
3.4.1 模型的建立 88
3.4.2 数据描述 90
3.4.3 实证统计 91
3.4.4 随机模型的运用 94
3.5 社会影响对用户选择行为的影响 96
3.5.1 社会影响与用户偏好网络模型建立及其结构特性 96
3.5.2 网络数据分析 103
3.5.3 数值模拟 107
参考文献 110
第4章 网络中的节点重要性度量 113
4.1 网络中节点重要性排序的研究进展 113
4.1.1 基于网络结构的节点重要性排序方法 114
4.1.2 基于传播动力学的节点重要性排序方法 124
4.2 复杂网络中*小k-核节点的传播能力分析 125
4.2.1 理论基础与方法 126
4.2.2 数值仿真与结果分析 128
4.3 基于k-核与距离的节点传播影响力排序方法研究 131
4.3.1 基于k-核与距离的节点传播影响力排序度量方法 132
4.3.2 实验数据及相关参数 132
4.3.3 数值仿真与结果分析 133
4.4 基于度与集聚系数的网络节点重要性度量方法研究 137
4.4.1 理论基础与方法 138
4.4.2 实例验证 141
参考文献 143
第5章 个性化**系统的相关理论概念 148
5.1 二部分网络 148
5.2 个性化**算法 152
5.2.1 基于协同过滤算法的**系统 152
5.2.2 基于内容的**系统 152
5.2.3 基于网络结构的**系统 153
5.2.4 基于混合**算法的**系统 153
5.2.5 其他**算法 153
5.3 常用数据集 154
5.3.1 MovieLens数据集 154
5.3.2 Netflix数据集 155
5.3.3 Delicious数据集 155
5.3.4 Amazon数据集 155
5.4 评价指标 157
5.4.1 **的准确度 158
5.4.2 被**产品的流行性 159
5.4.3 **产品的多样性 159
5.4.4 分类准确度、准确率与召回率 160
5.4.5 F度量 160
5.4.6 新颖性 161
5.5 相似性 161
5.5.1 基于打分的相似性 161
5.5.2 结构相似性 162
5.6 小结 165
参考文献 167
第6章 协同过滤**系统的算法研究 170
6.1 协同过滤**算法 170
6.1.1 基于用户的协同过滤**算法 170
6.1.2 基于产品的协同过滤**算法 172
6.2 用户关联网络对协同过滤**算法的影响研究 174
6.2.1 用户关联网络简介 174
6.2.2 用户关联网络统计属性 175
6.2.3 基于用户关联网络的协同过滤**算法 178
6.3 考虑负相关性信息的协同过滤**算法研究 180
6.3.1 算法介绍 181
6.3.2 实验结果分析 182
6.4 集聚系数对协同过滤**算法的影响研究 185
6.4.1 产品集聚系数对协同过滤**算法的影响研究 185
6.4.2 用户集聚系数对协同过滤**算法的影响研究 186
6.4.3 数值结果分析 187
6.5 基于Sigmoid权重相似度的协同过滤**算法 190
6.5.1 基于Sigmoid权重相似度的协同过滤**算法 190
6.5.2 实验过程及结果分析 193
参考文献 195
第7章 基于网络结构的**算法研究 197
7.1 基于热传导的**算法 197
7.2 二部分图中局部信息对热传导**算法的影响研究 198
7.2.1 HC数值模拟结果 199
7.2.2 改进的HC数值模拟结果 200
7.3 基于物质扩散过程的**算法 202
7.4 基于物质扩散过程的协同过滤**算法 204
7.4.1 基于物质扩散过程的二阶协同过滤**算法 205
7.4.2 算法的数值实验结果 205
7.5 考虑用户喜好的物质扩散**算法 207
7.6 产品之间的高阶相关性对基于网络结构**算法的影响 209
7.6.1 基于网络结构的**算法 210
7.6.2 通过去除重复性的改进的算法 211
7.6.3 实验数据结果 213
7.7 有向相似性对协同过滤**系统的影响 215
7.7.1 用户相似性的方向性对CF算法的影响 216
7.7.2 基于*大相似性的CF算法 218
7.7.3 数值结果分析 219
7.8 二阶有向相似性对协同过滤**算法的影响 225
7.8.1 改进的算法 228
7.8.2 实验结果分析 229
7.9 时间窗口对热传导**模型的影响研究 233
7.9.1 基于局部信息的用户相似性指标 233
7.9.2 实证结果分析 234
7.10 考虑负面评价的个性化**算法研究 239
7.10.1 基于物质扩散模型 239
7.10.2 基于热传导模型 245
7.11 一种改进的混合**算法研究 250
7.11.1 模型与方法 250
7.11.2 实证结果分析 251
参考文献 254
第8章 基于内容的**算法研究 256
参考文献 259
第9章 混合**算法研究 260
参考文献 261
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

温馨提示:请使用泸西县图书馆的读者帐号和密码进行登录

点击获取验证码
登录