目录
第一章 研究背景与意义 1
1.1?问题的提出 1
1.2?研究现状 2
1.2.1?文本挖掘研究现状 3
1.2.2?国外相关技术研究现状 13
1.2.3?国内相关技术研究现状 17
1.3?研究意义 18
第二章 关键技术发展历程 21
2.1?关键词检索技术的发展 22
2.2?概率主题模型 28
2.3?深度学习技术的发展(word2vec) 35
2.4?并行计算及降维算法的发展 42
2.4.1?并行计算 42
2.4.2?降维算法 43
第三章 研究方案及数据处理方案 51
3.1?研究方案详述 51
3.2?数据处理方案详述 55
3.3?中英文文本预处理及其差异 56
第四章 技术研发与应用实践 61
4.1?语义挖掘理论研究与分布式并行计算方法研究 61
4.1.1?LSI技术研究 62
4.1.2?LDA技术研究 66
4.1.3?word2vec技术研究 72
4.2?语义挖掘分布式并行计算的实现及验证系统的开发 96
4.2.1?语义挖掘分布式并行计算的实现 96
4.2.2?验证系统前端实现 106
4.2.3?验证系统后端实现 113
4.3?结果展示及对比研究 121
4.3.1?词频和关键词检索定性结果对比 121
4.3.2?定量结果对比(对比词频和关键词检索) 130
第五章 主要研究结论 133
第六章 相关研究讨论 135
6.1?交叉领域关系讨论 135
6.2?研究应用前景探讨 142
6.3?word2vec的优化方向 146
6.4?文献领域语义挖掘多样化挑战 149
参考文献 153
温馨提示:请使用泸西县图书馆的读者帐号和密码进行登录