自然语言处理(NLP)是人工智能(AI)的重要应用领域,是继图像和语音处理技术(感知技术)突破之后的另一个令人期待的关涉认知技术的核心环节。
本书以答问的形式,站在人工智能应用的角度,深入浅出地阐述符号规则学派对于自然语言结构深度解析的创新和实践;对计算语言学的历史进行回顾和批判,提出洞穿乔姆斯基层级体系的可行架构和机制;以中文信息处理为主题,揭示多层深度句法解析对于自然语言应用的革命性作用的原理和威力;针对困扰中文信息处理近半个世纪的三大迷思,指出分词并非中文独有的前处理,词性辨识不必先行,递归并非自然语言的本性;通过对这三大问题的解答,揭示多层中文分词与解析的关系,词类识别与句法角色的关系,离合词(如“洗澡”)带来的词典与句法的接口关系等,从而梳理通向中文深度解析之路的痛点及难点,以及这些语言处理技术的创新所展示的深度句法解析在大数据场景中已经显示出来的应用价值,勾画其广阔的应用前景。
零 缘起
壹 自然语言与语言形式
贰 语言的符号模型
叁 中文分词的迷思
肆词 性标注的陷阱
伍 语言递归的误区
陆 乔姆斯基语言学反思
柒 深层解析是图不是树
捌 有限状态的机制创新
玖 错误放大与负负得
拾 歧义包容与休眠唤醒
附录一 术语索引
附录二 解析结构图图例
温馨提示:请使用泸西县图书馆的读者帐号和密码进行登录