第1章 概念背景图的数学基础
概念背景图(concept context graph,CCG)中的“概念”一词,借鉴人类自然语言中的“概念”,包含外延和内涵。概念的内涵是指一个概念反映的事物的本质属性的总和,即概念的内容。例如:“商品是用来交换的劳动产品”,其中,“用来交换的劳动产品”就是概念“商品”的内涵。概念的外延是指这个概念所反映的事物对象(人、地、事、物)的范围,即具有概念所反映的属性的事物或对象。内涵和外延之间存在着某种特殊的联系,这种联系表明,内涵所描述的属性是外延所有对象共同具有的,外延包含的所有对象也只能具有其内涵描述的属性。内涵对外延来讲是封闭的,外延对内涵来讲也是封闭的。一些概念之间存在着泛化、特化、同义、近义等关系。形式概念分析利用数学中的序、格将自然语言中的概念进行了形式化的定义,并对概念之间的这些关系进行讨论。本章重点讨论一些相关的序、格、概念格等内容。
1.1 偏序
一般来讲两个具有固定秩序的客体x和y组成一个序偶。序偶是有序二元组,与集合不同。对于集合而言。但对于序偶和,它们是不相等的。比如集合与集合是相同的,包括2和3两个元素,而直角坐标系上的点序偶和分别表示不同的点。
定义1.1(序偶相等)序偶和相等,即,当且仅当且。
在许多研究中,序偶常常来源于两个不同的集合或领域,用来研究两类不同事物之间的关系。任意给定两个集合,可以定义一种序偶。建立在一定应用背景下的序偶,其中的两个集合具有一定的联系,那么这样的序偶就有特定的意义。没有建立在一定应用背景下的序偶,是没有实际意义的。
定义1.2(笛卡儿积)令X与Y是任意两个集合,对于序偶,x是X中的元素,y是Y中的元素。所有这样的序偶的集合,称为集合X和Y的笛卡儿积或直积,记作,定义式为
(1.1)
例1.1 设X是三个网页的集合,包含三个不同的URL,即,Y是三个网页共有关键词的集合,包括人工智能(artificial intelligence,AI)和深度学习(deep learning,DL)。
定义1.3(二元关系)[1] 令X与Y是任意两个集合,集合,称R是X,Y的二元关系;若序偶,则记作。若,则说R是X上的二元关系。常用表示的逆关系,与是等价的。
例1.2
R1,R2,R3,R4,R5,R6都是集合,上的二元关系。
定义1.4(偏序关系)[1] 集合X上的二元关系R称为一个偏序关系,如果满足:
自反性(对任意,有);
反对称性(对任意,若且,那么一定不存在);
传递性(对任意,若且)。
在这里必须说明几个问题:
(1)关于偏序关系反对称性,对任意,若且,则。
(2)常常把偏序关系表示为,称为小于等于关系,一个集合X上的偏序记为。
①定义1.4中自反性可以描述为对任意,有;
②反对称性可以描述为对任意,若且,那么一定不存在;
③传递性可以描述为对任意,若且。
(3)R是X上的偏序关系,若对于,必有或,则R称为X上的全序。
①其反自反性可以描述为对任意,有;
②反对称性可以描述为对任意,若且,那么;
③传递性可以描述为对任意,若且。
例1.3 设,其是对任意包含的人物群体的包含关系,则为一个偏序集,也是一种非严格偏序。
设;X是Y的幂集合,其是对任意集合包含关系,则为一个偏序集,也是一种非严格偏序。
设X是互联网中网页的集合,其是对任意不存在环路的网页链接通路关系,由于网页自己不能链接自己,这种关系只能是。则为一个偏序集,也是一种严格偏序。
设X是世界所有人,其是对任意长晚辈关系,由于自己和自己不能构成长晚辈关系,这种关系只能是。则为一个偏序集,也是一种严格偏序。
设,X是Y的幂集合,其是对任意集合包含关系。则为一个偏序集,也是一种非严格偏序。
1.2 偏序与有向无环图
偏序关系可以用一个有向无环图表示,任意的是图中的结点,其具体代表X集合中的元素。该偏序中的任意一个有序对必然对应G中的一段弧。
定义1.5(邻近)[1] 在偏序关系中,对任意,若,且不存在,则称是的下邻近,是的上邻近。
例1.4 设,其是对任意集合包含关系,则图1.1是的偏序关系图。
图1.1 的偏序关系图
这种偏序关系图,可以理解为箭头结点比箭尾结点大,默认下端比上端的结点小,可以省略图中箭头,这样的图常常称为Hasse图。图1.2示意了常见的具有1到4格点半序关系的Hasse图。
图1.2 具有1到4格点半序关系的Hasse图[1]
定义1.6(偏序直积)[1] 两个偏序关系和,它们的直积定义为:,直积中关系表示满足且。
例1.5 设X是实数集,是实数的大小关系,它们构成二维直角坐标x轴,是一个偏序关系。设Y是实数集,是实数的大小关系,它们构成二维直角坐标y轴,是一个偏序关系。就是平面直角坐标系中的点,中满足,也即满足且。
1.3 格
在一个偏序关系中,N是X的一个子集,X中的元素满足对任意的,都有,则称是N的一个下界;如果N的所有下界组成的集合中有*大元素,则称这个元素为N的下确界。反之,在一个偏序关系中,N是X的一个子集,X中的元素s满足对任意的,都有,则称s是N的一个上界;如果N的所有上界组成的集合中有*小元素,则称这个元素为N的上确界。
图1.3是一个由10个结点组成的偏序关系,其中,则集合满足N的下界条件,1是N的下确界;集合满足N的上界条件,8是N的上确界。
图1.3 10个结点组成的偏序关系图[1]
定义1.7(完全格)[1] 设是偏序关系,若X的任意二元子集都存在上确界以及下确界,则称是格(lattice)。若X中任意子集都存在上确界以及下确界,则称是完全格。
(1)完全格中存在一个*大的元素(*小的上确界),称为1元素,也存在一个*小的元素(*大的下确界),称为0元素。
(2)在完全格中,*小元和*大元都为。
(3)在完全格上,定义两个运算和。对任意,若,则。运算和运算分别称为取大和取小运算。
(4)运算和运算满足结合律、交换律和分配律。对任意,有
结合律:
分配律:
交换律:
1.4 闭包算子和Galois连接
定义1.8(闭包算子)[1] 给定偏序关系,在X上的闭包算子是函数,如果满足以下三个条件:
(1)且,具有扩展性;
(2)若,则,是单调递增函数;
(3)且,是幂等函数。
定义1.9(Galois连接)[1] 给定两个偏序关系和,令和是它们之间的两个单调函数,与是Galois连接,当且仅当和满足以下三个条件:
(1)若,则;
(2)若,则;
(3)
Galois连接在其他参考文献中有另一种等价定义:和,如果,则,即,也称和是两个偏序关系和上的Galois连接。
定义1.10(关系Galois连接)[1] 集合X和Y上的任意一个二元关系,则X与Y之间的关系Galois连接和定义为
(1.2)
也即子集关系映射。
1.5 概念与概念格
概念是人类进行思维的*基本单位,是用来组织成为诸如判断、结论等更为复杂思想的基础,是人类进行知识表述的一种有效手段,属于哲学的范畴。基于Birkhoff对格理论的贡献,德国的Rudolf Wille在1982年首先将形式概念分析
展开