第1章 信息组织概述
1.1 本章导学
信息,是当今使用频率最高的词语之一。有人说:物质、能量和信息是构成客观世界的三大要素,即世界万物都存在物质与能量,而万物之间存在着的相互作用和相互联系就是信息,这种说法认为信息早就存在于客观世界,人们是首先认识了物质,然后认识了能量,最后才认识信息。也有人说:信息是人们在适应外部世界,并使这种适应反作用于外部世界的过程中,同外部世界进行互相交换的内容的名称。因此客观世界中存在着各种各样的信息现象,我们生活在信息时代,每天都在与信息打交道,信息就如同阳光、空气和水一样,在人类生活中必不可少。
在现代社会中,人们越来越认识到“信息”是一种资源,它可以成为人类社会发展的直接动力。但信息的爆炸式增长也带来一个至关重要且必须面对的问题:如何合理高效地利用这些信息,尤其是在不断发展和进步的科学与技术的浪潮中。针对这个问题,人们进行了诸多努力,从几千年前对图书文献的分类,到近现代信息组织工具的发展,再到各种网络信息组织技术的进步,以及深入到知识层面的组织,都说明了信息组织在此过程中的重要作用。
1.2 数据、信息与知识
信息组织是对信息进行组织、但信息的含义又较为抽象,它和数据、知识等概念存在密切关联,在学习什么是信息组织之前,需要对数据、信息和知识等概念以及它们之间的关系进行梳理。
1.2.1 数据
数据一般是指客观事物的真实记录或者对某一事件的统计性描述,可以是数字、图形、文字、音像、视频等符号的简单集合。不同领域对“数据”的定义各不相同。哲学家认为,数据是指人们为了描述客观世界中的具体事物而引入的一些数字、字符、文字等符号或符号的组合。计算机及通信领域专家认为,数据是在科学研究、设计、生产管理及日常生活等各个领域中,用来描述事物的数字、字母、符号、图表、图形或其他模拟量,例如试验数据、观测数据与统计数据等,它能够被计算、统计、传输及处理。管理学专家认为,数据是对客观事物、事件的记录和描述,是形成信息的基础。情报学专家认为,数据是事实(信息)的数字化、编码化、序列化和结构化。也有学者认为数据是对文本、图像或声音等最原始、无目的性且未经加工的表达,如果没有平台的支撑就没有任何意义。如单是数字“1”并不能代表任何内容,但是放在一定的环境中,如“1棵树”,它就能传递出相应的信息。
1.2.2 信息
对于信息的理解,各个领域也不尽相同。哲学领域专家认为,信息是客观世界中各种事物的状态和特征的反映,客观事物的状态和特征的不断变化促使信息不断产生。也就是说,人类社会、自然界、思维,乃至宇宙中的一切事物的存在方式及运动状态都有其固有的规律和特征,信息反映这些规律和特征。计算机及通信领域专家认为,信息是指所有可以通过视觉、听觉、嗅觉、味觉、触觉等感官获取并可以以文本、图形图像、音频视频等格式记录的内容。管理学专家认为,信息是经过处理后具有意义的数据,信息中的数据具有相关性。情报学专家认为,信息是数据在信息媒介上的映射,是有意义的数据。信息即人们根据表示数据所用的约定而赋予数据的意义。
今天,随着互联网的普及,网络世界把信息带到人类社会生活的每一个领域,人们感受到了信息的不可或缺性。人们对信息的理解包括在网络上传输的一切数据,信息是一个无所不包的庞大的集合体,也正是这样的信息环境,给信息的组织、获取和利用带来了更大的挑战。
1.2.3 知识
知识被认为是信息接收者通过对信息的提炼和推理而获得的正确结论,是人通过信息对自然界、人类社会以及思维方式与运动规律的认识与掌握,是人的大脑通过思维重新组合的、系统化的信息集合。1999年版《辞海》解释说知识是人类认识的成果或结晶。依反映层次的系统性,可分为经验知识和理论知识。另一方面,知识借助于一定的语言形式,或物化为某种劳动产品的形式,可以交流和传递给下一代,成为人类共同的精神财富。知识随着社会实践、科学技术的发展而发展,不同学科对其认知也不同,计算机及通信领域专家认为,知识是人们从实践经验中总结出来且为新的实践所证实的规律及经验的总结,是可以用于推理的规则。管理学专家认为,知识是基于人的经验、价值观等通过思考对信息进行推理、验证,从中得出的系统化的规律、概念和经验。情报学专家认为,知识是对信息的加工、吸收、提取、评价的结果。
知识大致可以分为两部分,即显性知识和隐性知识。
显性知识是指记录在各种介质上的知识,如图书、档案、数据库、计划、总结、报表等。显性知识是具有有形的物质载体、被符号化了的知识,它是知识的一种沉淀,属静态知识。也有学者认为,信息是可编码化的知识,显性知识就是信息的重要组成部分,因为它具有载体,属于存在的客观事物,有自己的状态,本书同意这种观点,并且在后面知识组织部分沿用此观点。
隐性知识则指存在于人的头脑中的未编码的经验性知识,如个人的技术诀窍、直觉、想象与创意等,是高度个性化的且难以格式化的知识,是活跃着的动态知识,且只能通过与专家直接交流才能获得。实际上隐性知识本身并不是未编码的,它也是通过一种特殊的编码方式存储在人的大脑中,只是目前科技还没有能力揭示它的原理而已,人类尝试研制的生物电脑就是要模拟人脑对知识的编码、存储与检索等功能。
知识具有普遍性,不随时间变化而变化,也就是说在条件不变的情况下,知识是相对稳定的、可重复的。近年来,随着知识处理、知识工程技术和方法的发展,越来越多的系统能够通过揭示知识单元、挖掘知识之间的关联对显性知识进行处理,甚至利用计算机模拟人的大脑的思维活动对隐性知识进行利用,快捷地为用户提供有效知识或信息。
1.2.4 数据、信息和知识之间的关系
从前面的概念介绍可以看出,数据、信息和知识之间存在密切联系。对于三者之间的关系,包括并列关系、转化关系、包含关系和层次关系等。本书借鉴信息链理论,主要介绍转化关系和层次关系的观点,认为数据、信息和知识呈现金字塔式的层次关系,即从数据到信息、从信息到知识概念依次变小,同时也是一种价值不断增高的递进式关系。
数据向信息的转化主要是在数据与研究问题之间建立相关性。也就是说对信息的接收始于对数据的接收,对信息的获取则只能通过对数据背景的解读,数据背景是接收者针对特定数据的信息准备,即当接收者了解物理符号序列的规律,并知道每个符号和符号组合的指向性目标或含义时,便可以获得一组数据所荷载的信息,亦即数据转化为信息,可以表达为如下公式:
数据+背景=信息
例如数字95是数据,如果接收者了解它是某位同学“信息组织”的课程成绩,这时数据就转化成了信息。数据加工也是数据转化为信息的过程,即运用相关知识将具有相关性的数据整合起来,并格式化、规范化使之成为信息分析中的有效数据。典型的加工方式包括数据清洗、数据滤重、信息检索、情境揭示、同名区分、别名归一、翻译等。
信息向数据的转化主要是选择合适的方法和标识符号记录信息。信息作为一种社会现象,随人类社会的产生而产生,随人类交流的发展而发展。为了便于交流,就需要进行记录,从而形成了数据。起初人类并不知道如何去描述身边的事物以及事物之间的关系。在漫长的劳动实践中,人们逐渐学会了利用一些特殊的符号来记录客观世界的状况,这些符号就可以看成是最原始的数据。随着科学技术以及数据管理工具的发展,例如数据库的出现,提高了信息向数据转化的效率。人们使用符号记录信息的过程也不再是随心所欲,逐渐考虑这一转换过程的标准、规范和可共享的可能性,于是更多的规范化手段出现。因为只有标准化、规范化,这些数据才能够在后续的分析、处理和利用过程中被赋以相同的背景,展现原有信息的内容含义,这其实就是信息组织中信息描述需要关注的核心问题。
信息向知识的转化体现在人类发展和社会生活中。人类在接收了来自自然界的大量信息后,通过实践活动和大脑的思维活动,将这些信息进行分析与综合,形成新的认识,这种经过人脑加工后的信息成为知识。或者说知识是同类信息的深化、积累,是优化了的信息的汇总和结晶。知识的传输一般遵循如下模式:
传输者的知识→数据→信息→接收者的知识
这一模式说明,要传输知识,传输者首先要将头脑中的知识转化为数据,即按一定的规则排列组合成符号,再通过一定的渠道将数据传至接收者。这种转化的成功性依赖于传输者对知识的理解以及对转化过程的熟练程度。接收者如果能够解读数据的背景与规则,则可接收到相关的信息,然而最终能否获取传输者意欲传递的知识,还取决于接收者个人对信息的提炼与推理。只有当信息接收者接收信息,并能够从中提取关于事物的正确理解和对现实世界的合理解释时,信息才能转化为知识。可见,信息能够转化为知识的关键在于信息接收者对信息的理解能力。对信息的理解能力取决于接收者的知识准备。如在教学活动中,教师将其大脑中存储的知识转换为授课信息,授课信息可能是口头信息,也可能是文本信息,学生接收到这些信息,结合自己大脑知识结构以及个人的思维能力,才能将其转化为知识,所以一个老师上课,同一个班的不同学生,这个转化过程也会有一定差异。信息转化为知识的机理虽然复杂,但有一点可以肯定:信息只有同接收者的个人经验、信息与知识准备相结合,即同接收者的个人背景融合才能转化为知识。同样,我们可以表达为
信息+经验=知识
由此可见,知识的获取只能通过学习和体验实现,而人的认识能力和理解能力为知识转化为数据、数据转化为信息、信息转化为知识、知识的有效融合、新知识的创造提供了必不可少的条件。
知识向信息的转化也主要体现在人类发展和社会生活中,如上所述,人们的各种社会活动、实践都是对知识的运用,在知识运用过程中,知识传输者需要先将头脑中的知识进行转化才能最终完成传输过程。
数据、信息和知识三者之间存在复杂的关联,并不能截然分开。例如目前极为常见的智能传感器设备,它能够随时监控事物的状态并及时按照设定规则将其转化为数据,后台的工作人员通过这些数据获得有意义的信息,同时也可以在这些信息的基础上生成新的数据,在此过程中信息数据在不断发生转化。
领域与规则知识的应用也与转化过程密切相关。如信息转化为数据的过程基于信息的类型、形式和特征进行,这就需要与各行各业具体的事物相结合,与各学科领域的基础知识相关联,需要有各领域专家的积极参与。数据转化为信息也需要根据数据的规律,对数据进行加工处理,而这些规律本身就是知识,其中包括对有效数据的判别与筛选、数据结构、多源数据的融合知识等,这些知识的利用可以是人工直接操作,也可以由人根据知识制定规则,计算机根据规则自动完成。以科技情报工作为例,首先将海量的科技文献信息利用适当的规范的符号记录和处理,形成海量数据库,这个过程可以看作科技文献信息向数据转化的过程。而进行科技服务工作时,就需要从海量数据库中检索出与问题相关的文献,这就是一种数据加工过程,是数据转化为信息的过程。该过程涉及许多信息检索知识和专业领域知识,包括数据库的收录范围、检索系统的信息组织标引方法、检索结果的排序机制等,以及专业领域内概念之间的关系、词汇的控制和缩略语与术语全称的转换对应等。
对数据、信息、知识的加工和处理要紧紧围绕核心目标,即对数据、信息、知识的获取和利用进行。但是因为数据、信息、知识存在状态和形式的差异,其加工处理的手段差异也比较大。例如数据多存在于数据库以及软件平台中,需要更多的工具来辅助获取和分析,信息多以有形载体多种文献类型而存在,需要根据不同信息形式选择合适的方法手段进行处理,知识则更多存储在人的大脑里,采用怎样的组织技术能够使这些知识长久保存、被更多的人利用,甚至能利用知识结构模拟大脑活动产生新知识和新信息是重点。
1.3 信息组织的理解
信息组织的目的是促进对信息的获取与利用。信息是事物的客观存在状态,很多情况下它是很抽象的,需要使用符号系统将其结构化和数据化。
1.3.1 信息组织的含义
1.学者们的观点
马费成认为信息组织是利用一定的规则、方法和技术对信息的外在特征和内容特征进行揭示和描述,并按给定的参数和序列公式排序,使信息从无序集合转化为有序集合,将信息转
温馨提示:请使用泸西县图书馆的读者帐号和密码进行登录