泸西县图书馆“U书快借”平台

作者简介

李维，加拿大Simon Fraser University计算语言学博士、中国社会科学院研究生院机器翻译专业硕士。现任科大讯飞研究院首席研究员。曾任美国硅谷社交舆情公司Netbase首席科学家、Cymfony任研发副总及美国国防部信息抽取创新研究项目的主研究员（PI）、京东硅谷研究院主任研究员、京东与斯坦福AI合作项目知识图谱的学术带头人（PI）等。在国际D级学术刊物和大会上发表论文约30篇，并在“科学网”以及北美多个华文网站开办NLP网上大学和NLP频道，深受人工智能和NLP领域认识追捧，在网上网下均有不俗的影响力。

郭进，1994年新加坡国立大学计算机科学博士，主攻中文分词和统计模型，成果见于《计算语言学》等刊。1998年赴美，先后在摩托罗拉、亚马逊、京东硅谷研究院等从事人工智能研究，探索将机器学习、自然语言处理等人机交互技术应用于互联网与物联网的解决方案。

展开

内容介绍

自然语言处理（NLP）是人工智能（AI）的重要应用领域，是继图像和语音处理技术（感知技术）突破之后的另一个令人期待的关涉认知技术的核心环节。

本书以答问的形式，站在人工智能应用的角度，深入浅出地阐述符号规则学派对于自然语言结构深度解析的创新和实践；对计算语言学的历史进行回顾和批判，提出洞穿乔姆斯基层级体系的可行架构和机制；以中文信息处理为主题，揭示多层深度句法解析对于自然语言应用的革命性作用的原理和威力；针对困扰中文信息处理近半个世纪的三大迷思，指出分词并非中文独有的前处理，词性辨识不必先行，递归并非自然语言的本性；通过对这三大问题的解答，揭示多层中文分词与解析的关系，词类识别与句法角色的关系，离合词（如“洗澡”）带来的词典与句法的接口关系等，从而梳理通向中文深度解析之路的痛点及难点，以及这些语言处理技术的创新所展示的深度句法解析在大数据场景中已经显示出来的应用价值，勾画其广阔的应用前景。

展开

零缘起

壹自然语言与语言形式

贰语言的符号模型

叁中文分词的迷思

肆词性标注的陷阱

伍语言递归的误区

陆乔姆斯基语言学反思

柒深层解析是图不是树

捌有限状态的机制创新

玖错误放大与负负得

拾歧义包容与休眠唤醒

附录一术语索引

附录二解析结构图图例

展开