本书运用结构主义语言学、语料库语言学、认知语言学、功能语言学等多种理论,对现代汉语指人名词进行研究。并探讨了由计算机处理汉语引发的语言工程的系统性、两可现象与语法规则、语法、非语法形式与静态、动态等问题。
一、语法研究对汉语语料库加工的作用
(一)语法研究的已有成果是语料库加工的前提
语言有形式和意义两方面,计算机处理汉语,可以从任何一个方面入手。从形式出发,就是要分出大大小小的句法类,然后以此为基点去分析语言成分间由句法到语义直至语用的种种关系,最终完成对自然语言的理解。而从意义出发,就是要分出大大小小的语义类,然后追踪由深层意义到表层形式的映射,至于各语言成分的句法类别则是这种分析水到渠成的结果。
如第三节所述,后一种思想并没有用于大规模汉语语料的加工,很重要的原因是语法界在给意义分类方面尚无成熟的成果可资借鉴,信息界为开发系统所作的语义分类探索至今仍举步维艰。相形之下,从形式入手是信息界的主流作法,因为在划分汉语词语形式类方面语法学界已做了许多有益的研究,其成果可直接拿来利用。
我们知道,现代汉语词类问题经过语法界的长期论争,若干重大理论问题已基本达成共识,即汉语词类的划分目的是为了说明句法结构;划分标准主要是句法功能,兼顾意义和形态;划分结果最好兼顾“词有定类”和“类有定职”。这些思想对当前的语言工程实践具有极其重要的指导意义。
只要简单对比一下现有的几个比较成功的汉语处理系统,就会发现,它们所使用的现代汉语词类标记集尽管大小类粗细程度有很大差异。但在第一个层面词的大类划分上,都遵循了词的句法功能这一原则。此外,在判定多类词词性时,一般都坚持了句法功能。以北京大学语料库为例,譬如:
形容词和动词的区分,看它能否带宾语,带上宾语就是动词。如例9中的“红”:
(9)他跟她没红过脸。(10)这花很红。
介词和动词的区分,看它能否单独作谓语,能单独作谓语就是动词。如例11中的“在”:
(11)你爸爸在不在?(12)他在教室自习。
若句法环境不足以区分多类词词性,就兼顾意义:
(13)科恩致词得到了与会代表的赞同。
(14)开拓多渠道的投资格局。
根据该系统所依据的语法体系,例13中的“致词”、例14中的“投资”不论标为动词还是名词,都是可行的。但考虑到,这里的“致词”不是指动作“表达言词”,而是指实体“言词”;“投资”不是指“资金”,而是指“投入资金”。因此,这两例中的“致词”“投资”分别标为名词、动词。类似的还有“讲话”“谈话”“报告”“祝词”“发言”“建议”“计划”“导演”等。显然,上述处理方法较好地保证了语料初加工的质量,并为以后的深加工打下了基础。
第一章 引言:语料库与语言学研究
1.自然语言处理与语料库
2.语料库发展与语言学理论
3.汉语语料库与中文信息处理
4.现代汉语语料库与语法研究
第二章 研究背景
1.选题的目的
2.选题的依据
3.面向信息处理的“名·名”研究现状简介
4.选题的研究定位
5.选题的研究思路
第三章 关于名词多层级分类标注的构想
1.理论架构
2.名词多层级加工实践
3.对MCT法的理论反思
4.小 结
第四章 指人名词的分类研究
1.已有的分类研究
2.指人名词的确定
3.指人名词分类的必要性及方法
4.框架测试法的理据及运用
5.指人名词分类结果
6.余 论
第五章 指人名词同位组构的内部限制
1.“同位”概念的历史
2.同位短语的地位
3.现存的问题
4.指人名词同位组构模式
5.余 论
第六章 指人名词同位组构的外部限制
1.外部研究要解决的问题
2.外部定界规则的类型、表述形式和特点
3.确认规则
4.否认规则
5.有待进一步研究的若干问题
6.余论
第七章 小结
1.本书研究的总结
2.与本书研究相关的若干问题
参考文献
附录1:指人名词表
附录2:名词研究札记二则
附录3:现代汉语否定肯定对用格式研究
温馨提示:请使用泸西县图书馆的读者帐号和密码进行登录