系统的研究了基于网络大数据的网络舆情及其涨落,并涵盖了对舆情大数据的挖掘处理代码的讲解。
本书从理论、方法和技术的角度,较为系统的研究了基于网络大数据的网络舆情及其涨落。内容囊括了从基本概念理论到数据采集预处理,再到挖掘与利用等各个环节。具体研究内容设计舆情及网络舆情的理论涵义拓展、典型网络平台特征分析与研究、不同平台网络数据的抽取研究、基于抽取数据的网络舆情热点识别发现研究、网络舆情数据的网络分析和内容分析研究、网络舆情的涨落研究及案例研究。最后对网络舆情中各种安全问题做了总结性研究,尤其重点阐述了暂未在网络舆情领域受到重视的信息隐藏安全问题。
前 言… …………………………………………………………………………………… 1 1 引论……………………………………………………………………………………… 1
1.1 舆论… ……………………………………………………………………………… 2
1.2 舆情… ……………………………………………………………………………… 4
1.3 舆论与舆情的关系… ……………………………………………………………… 6
1.4 广义舆情… ………………………………………………………………………… 8
1.4.1 舆情的定义… ……………………………………………………………… 8
1.4.2 反应… ……………………………………………………………………… 9
1.4.3 环境… ……………………………………………………………………… 9
1.4.4 刺激… ………………………………………………………………………11
1.4.5 舆情要素… …………………………………………………………………12
1.4.6 舆情空间… …………………………………………………………………16
1.4.7 舆情中的时间问题… ………………………………………………………19
1.5 网络舆情… …………………………………………………………………………20
1.5.1 网络舆情的传播过程… ……………………………………………………22
1.5.2 网络舆情的生命周期… ……………………………………………………23
1.5.3 网络舆情的特性… …………………………………………………………24
1.6 国内网络舆情的文献分析… ………………………………………………………28
1.6.1 网络舆情的研究趋势… ……………………………………………………28
1.6.2 网络舆情研究的主要内容… ………………………………………………31
1.7 网络舆情及其涨落研究的意义… …………………………………………………32
1.8 本书组织架构… ……………………………………………………………………33
2 网络舆情涨落研究之基——网络舆情媒体平台特征研究…………………………37
2.1 新闻网站… …………………………………………………………………………38
2.2 论坛… ………………………………………………………………………………39 2.3 微信… ………………………………………………………………………………42
2.4 微博… ………………………………………………………………………………42
2.5 关于媒体平台的几点深入探讨… …………………………………………………44
2.5.1 记忆效应… …………………………………………………………………44
2.5.2 操作代价… …………………………………………………………………45
2.5.3 操作收益… …………………………………………………………………46
2.5.4 链式营销… …………………………………………………………………47
2.5.5 马甲营销… …………………………………………………………………48
2.5.6 关于赞… ……………………………………………………………………49
2.6 小结… ………………………………………………………………………………49
3 网络舆情涨落研究之源——网络舆情大数据信息的获取与抽取研究… ………51
3.1 通用网络舆情信息获取框架的设计理念… ………………………………………52
3.2 基于逻辑链接块的网页正文抽取… ………………………………………………55
3.2.1 引言… ………………………………………………………………………55
3.2.2 相关工作… …………………………………………………………………55
3.2.3 基于逻辑链接块的网页正文抽取模板生成及正文抽取… ………………57
3.2.4 实验… ………………………………………………………………………60
3.2.5 结语… ………………………………………………………………………62
3.3 论坛网页正文抽取研究… …………………………………………………………62
3.3.1 研究现状… …………………………………………………………………63
3.3.2 方法步骤及核心算法… ……………………………………………………64
3.3.3 实验结果… …………………………………………………………………68
3.4 案例分析… …………………………………………………………………………69
3.4.1 案例内容… …………………………………………………………………69
3.4.2 地域分析… …………………………………………………………………69
3.4.3 从网站看温州行业分布… …………………………………………………71
3.5 小结… ………………………………………………………………………………77
4 网络舆情涨落研究之本——网络舆情热点发现研究………………………………79
4.1 网络舆情热点的形成及发现… ……………………………………………………80
4.1.1 舆情热点的形成… …………………………………………………………80
4.1.2 舆情热点的发现… …………………………………………………………81
4.1.3 舆情热点的追踪… …………………………………………………………82 4.2 基于 n-Grams 的语言无关性文本相似度计算研究………………………………82
4.2.1 引言… ………………………………………………………………………82
4.2.2 相关研究及存在的问题… …………………………………………………83
4.2.3 方法及原理… ………………………………………………………………85
4.2.4 实验设计及结果分析… ……………………………………………………87
4.2.5 结束语… ……………………………………………………………………92
4.3 文本相似度计算的随机策略研究… ………………………………………………93
4.3.1 引言… ………………………………………………………………………93
4.3.2 相关研究及存在的问题… …………………………………………………93
4.3.3 R-Grams 中的随机策略… …………………………………………………95
4.3.4 实验设计与结果分析… ……………………………………………………96
4.3.5 小结与讨论… …………………………………………………………… 100
4.4 基于随机 n-Grams 的聚类及热点发现算法研究……………………………… 100
4.4.1 引言… …………………………………………………………………… 100
4.4.2 相关研究及问题… ……………………………………………………… 101
4.4.3 方法及原理… …………………………………………………………… 102
4.4.4 实验及结果分析… ……………………………………………………… 104
4.4.5 结束语… ………………………………………………………………… 110
4.5 小结… …………………………………………………………………………… 110
5 网络舆情涨落研究之术——网络舆情大数据内容分析及网络分析…………… 111
5.1 词云分析… ……………………………………………………………………… 112
5.2 基于词项距离的共现分析法研究… …………………………………………… 113
5.2.1 共现分析… ……………………………………………………………… 113
5.2.2 文本共现分析一般性思路… …………………………………………… 114
5.2.3 基于词项距离的共现网络分析法… …………………………………… 115
5.3 基于网络拓扑和权值的虚拟团伙识别研究… ………………………………… 121
5.4 案例分析… ……………………………………………………………………… 126
5.4.1 研究对象… ……………………………………………………………… 127
5.4.2 监测数据分析… ………………………………………………………… 128
5.4.3 会员网络分析… ………………………………………………………… 134
5.4.4 内容分析… ……………………………………………………………… 138
5.4.5 结束语… ………………………………………………………………… 143 5.5 小结… …………………………………………………………………………… 143
6 网络舆情涨落研究之心——网络舆情涨落机制研究…………………………… 145
6.1 网络舆情的涨落机制… ………………………………………………………… 146
6.1.1 涨落与刺激… …………………………………………………………… 146
6.1.2 涨落与失真… …………………………………………………………… 147
6.1.3 涨落与环境差异… ……………………………………………………… 148
6.1.4 刺激与失真… …………………………………………………………… 149
6.1.5 刺激与环境差异… ……………………………………………………… 149
6.1.6 小结… …………………………………………………………………… 151
6.2 网络舆情涨落的探知研究… …………………………………………………… 152
6.3 网络舆情涨落研究的一般范式… ……………………………………………… 152
6.4 时间维度的演化涨落研究… …………………………………………………… 153
6.5 用户维度的演化涨落研究… …………………………………………………… 156
6.6 媒体维度的演化涨落研究… …………………………………………………… 158
6.7 网络舆情涨落中的文本情感分析研究… ……………………………………… 159
6.8 舆情涨落中的不当应对 10 字诀……………………………………………… 160
6.9 小结… …………………………………………………………………………… 164
7 网络舆情涨落研究之因——网络舆情中形形色色的安全问题………………… 165
7.1 网络舆情载体平台安全… ……………………………………………………… 166
7.2 网络舆情载体的内容安全… …………………………………………………… 167
7.3 基于网络舆情载体的信息隐藏安全问题… …………………………………… 167
7.4 小结… …………………………………………………………………………… 176
附 录… ………………………………………………………………………………… 177
附录 1 网页信息隐藏与隐藏信息提取…………………………………………… 178
附录 2 文本信息隐藏与隐藏信息提取…………………………………………… 180
参考文献… ……………………………………………………………………………… 183
温馨提示:请使用浙江工贸职业技术学院的读者帐号和密码进行登录