云书馆

产品特色

编辑推荐

展开

作者简介

展开

内容介绍

本书以文本的抄袭检测为研究对象，探索了抄袭检测的语料库构建、Web环境下的抄袭源检索和高模糊抄袭检测的文本对齐的问题、数据、架构和模型。全书共9章，第1～3章介绍了抄袭检测的概念、类型和框架，综述了抄袭检测的方法；第4章介绍了现有抄袭语料构建方法，提出了基于自然标注的抄袭语料构建方法；第5和第6章对抄袭源检索开展研究，描述了基于排序学习的源检索查询生成模型和关注检索结果聚合性的源检索过滤模型；第7～9章，对抄袭检测的文本对齐开展研究，提出了基于排序学习的抄袭文本匹配模型、句法和语义交互的释义文本深度匹配模型以及基于序列标注的文本对齐模型。本书可供对文本的抄袭检测感兴趣的研究人员和工程技术人员阅读参考。

展开

精彩书评

展开

精彩书摘

展开

前言
第1章绪论
1.1 研究背景及意义
1.2 抄袭检测的研究现状及发展趋势
1.2.1 抄袭检测任务简介
1.2.2 抄袭语料构建
1.2.3 源检索的查询生成
1.2.4 源检索的检索结果过滤
1.2.5 释义抄袭文本匹配
1.2.6 抄袭片段对齐
1.3 研究的主要目标、内容和结构
参考文献
第2章抄袭检测的概念、类型和框架
2.1 引言
2.2 文本复用的概念和方式
2.2.1 文本复用的概念
2.2.2 文本复用的方式
2.3 抄袭的概念和历史
2.3.1 抄袭的概念
2.3.2 抄袭的历史
2.4 抄袭的类型
2.5 抄袭检测的框架
2.5.1 外部抄袭检测的一般检索过程
2.5.2 抄袭源检索的过程框架
2.5.3 文本对齐的过程框架
2.5.4 内部抄袭检测的过程框架
2.5.5 跨语言抄袭检测的过程框架
2.6 本章小结
参考文献
第3章抄袭检测的方法综述
3.1 引言
3.2 基于指纹的抄袭检测方法
3.2.1 指纹的生成
3.2.2 指纹的匹配
3.3 基于词袋模型的抄袭检测方法
3.4 基于TFIDF模型的抄袭检测方法
3.5 基于n-gram模型的抄袭检测方法
3.6 基于句法的抄袭检测方法
3.7 基于语言连续表示的抄袭检测方法
3.7.1 基于跨语言明确语义分析的跨语言抄袭检测方法
3.7.2 基于跨语言潜在语义分析的跨语言抄袭检测方法
3.8 本章小结
参考文献
第4章基于自然标注的抄袭语料构建方法
4.1 引言
4.2 现有抄袭语料构建方法和问题分析
4.2.1 Webis系列抄袭检测语料库
4.2.2 CPSA语料库
4.2.3 METER语料库
4.2.4 其他语料
4.2.5 抄袭检测语料库构建总结
4.3 基于自然标注的抄袭语料构建
4.3.1 自然标注的基本思想
4.3.2 基于自然标注构建抄袭语料的可行性
4.3.3 抄袭语料构建算法
4.3.4 抄袭文本对齐的评价标准
4.4 语料质量分析
4.4.1 数据的收集和参数的设置
4.4.2 数据集的统计信息
4.4.3 数据集质量的评价
4.5 本章小结
参考文献
第5章基于排序学习的源检索查询生成模型
5.1 引言
5.2 查询对源检索性能影响分析
5.3 基于排序学习的源检索查询生成框架
5.4 构建训练数据
5.5 构建查询生成模型
5.5.1 排序备选查询的学习算法
5.5.2 排序模型的特征
5.6 实验与分析
5.6.1 数据集
5.6.2 评价指标
5.6.3 实验设置
5.6.4 实验结果与分析
5.6.5 实验结果的进一步讨论
5.7 本章小结
参考文献
第6章关注检索结果聚合性的源检索过滤模型
6.1 引言
6.2 源检索过滤问题分析
6.2.1 源检索中分类模型和排序模型的判别能力分析
6.2.2 源检索结果的聚合性分析
6.3 基于聚合性的源检索过滤
6.3.1 源检索过滤的排序学习框架
6.3.2 基于逻辑回归的排序学习算法
6.3.3 关注检索结果聚合性的源检索过滤模型
6.4 实验与分析
6.4.1 数据集
6.4.2 评价指标
6.4.3 实验设置
6.4.4 实验结果与分析
6.5 本章小结
参考文献
第7章基于排序学习的抄袭文本匹配模型
7.1 引言
7.2 抄袭文本匹配的问题分析
7.3 基于排序学习的抄袭检测文本匹配
7.3.1 抄袭文本匹配模型
7.3.2 抄袭文本匹配的排序学习算法
7.3.3 基于METEOR评价指标的特征
7.4 实验与分析
7.4.1 数据集
7.4.2 评价指标
7.4.3 实验设置
7.4.4 实验结果与分析
7.5 本章小结
参考文献
第8章句法和语义交互的释义文本深度匹配模型
8.1 引言
8.2 释义文本匹配分析
8.3 句法和语义交互的释义文本深度匹配
8.3.1 释义文本深度匹配模型概述
8.3.2 基于张量交互句法和语义的句子表达
8.3.3 基于卷积神经网的释义句匹配
8.3.4 融合词汇特征的释义文本深度匹配模型
8.4 实验与分析
8.4.1 数据集
8.4.2 评价指标
8.4.3 实验设置
8.4.4 实验结果与分析
8.5 本章小结
参考文献
第9章基于序列标注的文本对齐模型
9.1 引言
9.2 抄袭文本对齐问题分析
9.3 基于序列标注的文本对齐
9.3.1 文本对齐的机器学习框架
9.3.2 模型选择
9.3.3 基于条件随机场的抄袭文本对齐模型
9.4 实验与分析
9.4.1 数据集
9.4.2 实验设置
9.4.3 实验结果与分析
9.5 本章小结
参考文献
结论
彩图

展开