搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
出版时间 :
半结构化数据管理关键算法研究与实证/中南财经政法大学青年学术文库
0.00     定价 ¥ 40.00
浙江工贸职业技术学院
此书还可采购1本,持证读者免费借回家
  • ISBN:
    9787520325059
  • 作      者:
    作者:张引|总主编:姚莉
  • 出 版 社 :
    中国社会科学出版社
  • 出版日期:
    2018-08-01
收藏
畅销推荐
内容介绍
在云计算和物联网等新兴信息技术高速发展的今天,由于半结构化数据具有灵活易扩展的存储结构,已被许多信息系统和应用作为公共数据模型,被广泛地用于大规模异构数据的使用场景中。几乎所有行业都制定了描述和共享本领域数据的半结构化数据模型应用标准。随着半结构化数据的广泛使用,如何对大规模半结构化数据进行有效的管理,在学术界是一个重要的研究课题,而在工业界又是一项具有广阔应用前景的技术。张引著的《半结构化数据管理关键算法研究与实证》以XML为代表,探讨了大规模半结构化数据管理中的模式提取、节点编码、索引与查询处理等关键问题。本书既适合初学者作为基础学习资料,又适合科研人员作为理论研究教程,更适合从业人员作为技术参考书目。
展开
目录
第一章 半结构化数据的应用背景
第一节 研究背景
第二节 研究内容及意义
一 研究内容
二 研究意义
第三节 本书结构
第二章 半结构化数据的基础知识
第一节 半结构化数据的结构特征
第二节 半结构化数据的结构模型
第三节 半结构化数据的模式语言
第四节 半结构化数据的查询语言
第五节 半结构化数据的应用程序接口
第三章 半结构化数据的管理模型
第一节 半结构化数据模式提取的相关研究
第二节 半结构化数据节点编码的相关研究
第三节 半结构化数据索引的相关研究
第四节 半结构化数据查询处理的相关研究
第四章 半结构化数据的模式提取
第一节 半结构化数据的元素内容模型
一 半结构化数据的树状结构模型
二 半结构化数据的元素内容模型
三 提取大规模半结构化数据模式的质量标准
第二节 基于正则表达式的模式提取方法
一 元素内容模型的正则表示
二 XStruct算法简介
三 XStruct算法的优缺点
第三节 基于集合/序列的模式提取方法——XTree
一 XTree算法的组成
二 基于集合/序列的元素内容模型
三 XTree的数据结构
四 提取元素内容模型
五 识别数据类型
六 提取属性
七 输出模式
第四节 实证研究
一 XTree的算法的时间和空间复杂度分析
二 元素内容模型的有序性判断对模式准确性的影响
三 实验环境及测试工具
四 测试数据集
五 提取不同文档的模式的时间和内存消耗以及准确性
六 XTree算法提取同结构的不同大小的数据模式的时间消耗
第五节 小结
第五章 半结构化数据的节点编码
第一节 半结构化数据节点编码的特点
一 半结构化数据节点编码的质量评价标准
二 基于区间的节点编码方案
三 基于前缀的节点编码方案
四 ORDPATH编码方案
第二节 D2编码方案
一 D2编码方案的基本概念
二 静态D2编码
三 动态D2编码
第三节 D2编码的二进制表示
一 D2编码的二进制表示
二 D2物理编码的比较
第四节 实证研究
一 D2物理编码长度分析
二 D2物理编码长度实验
第五节 小结
第六章 半结构化数据的索引和查询处理
第一节 D2-Index索引策略
一 主索引
二 辅助索引
三 索引的动态更新
第二节 基于D2-Index索引策略的查询处理
一 查询语言
二 查询器
第三节 实证研究
第四节 小结
第七章 半结构化数据与大数据
第一节 大数据时代来临
第二节 大数据基础
一 大数据的定义
二 传统数据分析方法
三 大数据分析方法
四 大数据分析模式
五 大数据分析工具
第三节 大数据应用
一 应用演化
二 大数据分析的关键领域
三 大数据的典型应用
四 大数据的研究现状及发展趋势
第八章 总结
第一节 主要内容
第二节 未来研究展望
一 大规模半结构化数据模式的更新
二 大规模半结构化数据的信息检索
三 分布式半结构化数据的管理
参考文献
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

温馨提示:请使用浙江工贸职业技术学院的读者帐号和密码进行登录

点击获取验证码
登录