本书克服以往数据库系列教材理论性太强的弱点,针对物流专业的学生以浅显的语言去表达相关的原理,使得学生更易接受相关知识。体系完整,理论充实。
随着计算机应用技术和网络技术的普及,数据量急剧增加,人们借助计算机和数据库技术科学地保存和管理大量的、复杂的数据,以便能够更加方便、快捷地利用好这些珍贵的信息资源。在数据管理中,数据库系统起到了关键的作用,没有数据库的支持,根本不可能恰当地管理使用者需要的信息,数据库技术已经成为当今计算机信息系统的基础和核心。但是如何从海量的、分散的、复杂的数据海洋中,迅速找到有价值的和潜在有用的信息与知识,如何实现对这些数据的集中的组织、分析与管理,如何正确、有效地为企业做出决策,就需要数据仓库与数据挖掘来提供帮助了。数据挖掘理论与方法的研究与创新已经成为信息科学与管理领域重要的课题之一。
本教材正是结合数据库与数据挖掘技术的课程特点及应用需求、本科生乃至研究生的特点而编写的,力求克服原理与应用分离的缺点,弱化理论知识的抽象,体现注重能力、内容创新、结构合理、叙述通俗、易学易用的特点,全书以图文并茂的形式介绍数据库与数据挖掘的理论知识,以Microsoft SQL Server 2008乃至更高版本为平台,详细介绍了如何利用Microsoft SQL Server 2008进行数据库操作和数据挖掘的知识和方法。
本书是课程组结合多年的教学经验编写的。主要包括10个章节。
1数据库概论
本章主要介绍数据库系统的基本概念,包括数据库的基础概念、数据管理技术的发展过程、数据库系统的组成部分、关系数据库的规范化理论及数据库技术的发展趋势等。读者通过本章的学习,可以了解到为什么要使用数据库技术、如何使用数据库技术、数据库技术有哪些重要性等。
11数据库系统概述
数据库技术从20世纪60年代开始兴起,已有50余年的历史。所谓数据库是指长期储存在计算机内、有组织的、可共享的数据集合。而数据库管理系统是位于用户与操作系统之间的一层数据管理软件,它和操作系统一样是计算机的基础软件,也是一个大型复杂的软件系统。数据库是数据管理的最新技术,是计算机学科的重要分支。随着信息技术的发展,数据库管理系统已从专用的应用程序包发展成为通用的系统软件。由于数据库具有永久储存、较小冗余度、有组织、较高数据独立性和易扩展性等优点,许多庞大的信息系统都是以数据库为基础设计的。作为计算机学科的一个重要分支,数据库技术已被广泛应用于各行各业中,成为现代计算机信息系统和应用系统开发的核心技术和重要基础。
111数据库的基本概念
1信息与数据
在数据处理中,我们最常用到的基本概念就是数据和信息,信息与数据有着不同的含义。
(1)信息(Information)是客观事物存在方式或属性(状态)的反映。它反映的是关于某一客观系统中某一事物的某一方面的属性或某一时刻的表现形式。
具体地讲,信息是一种已经被加工为特定形式的数据,这种数据形式对接收者来说是有意义的,而且对当前和将来的决策具有明显的或实际的价值。
例如:“2020年生产量将提高10%”,对接收者有意义,使接收者据此做出决策。
(2)数据 (Data) 是反映客观事物属性的记录,是信息的载体。对客观事物属性的记录是用一定的符号来表达的,因此说数据是信息的具体表现形式。
可用多种不同的数据形式表示同一信息,而信息不随数据形式的不同而改变。
例如:“2020年生产量将提高10%”,其中的数据可改为汉字形式“二零二零年”“百分之十”。
数据所反映的事物属性是它的内容,而符号是它的形式。数据的表现形式多种多样,不仅有我们熟知的数字和文字,还可以有图形、图像、声音等形式。
(3)数据与信息的联系。数据与信息在概念上是有区别的。信息是有用的数据,数据是信息的表现形式。信息是通过数据符号来传播的,数据如不具有知识性和有用性则不能称其为信息。
数据是信息的符号表示或载体,信息则是数据的内涵,是对数据的语义解释。
例如:上例中的数据“2020”“10%”被赋予了特定的语义,它们就具有了传递信息的功能。
从信息处理角度来看,任何事物的属性都是通过数据来表示的;数据经过加工处理后,使其具有知识性,并对人类活动产生决策作用,从而形成信息。
用数据符号表示信息,其形式通常有三种:数值型数据,即对客观事物进行定量记录的符号,如体重、年龄、价格等;字符型数据,即对客观事物进行定性记录的符号,如姓名、单位、地址等;特殊型数据,如声音、视频、图像等。从计算机的角度来看,数据泛指那些可以被计算机接收并能够被计算机处理的符号。
数据和信息是密切相关联的,因此,在许多场合下,对它们不做严格的区分,可以互相使用。如通常说的“信息处理”与“数据处理”,“信息资源”与“数据资源”,“信息采集”与“数据采集”等具有同义性。
人们为了获取有价值的信息用于决策,就需要对数据进行处理和管理。
2数据处理
数据处理(也称信息处理)是将数据转换成信息的过程,包括对数据的收集、存储、加工、检索、传输等一系列活动。其目的是从大量的原始数据中抽取和推导出有价值的信息,作为决策的依据。
可用下式简单地表示信息、数据与数据处理的关系:
信息=数据+数据处理
数据是原料、是输入,而信息是产出、是输出结果。“信息处理”的真正含义应该是为了产生信息而处理数据。
3数据管理
数据管理是指对数据的收集、存储、加工、检索、传输等各种操作的总称,是数据处理的基本环节。
数据管理既是数据处理的基本环节,也是任何数据处理任务必有的共性部分。与其他技术的发展一样,计算机(电子)数据处理也经历了由低级到高级的发展过程。
4数据库与数据库管理系统
数据库(Data Base,DB):是长期储存在计算机内的、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。
数据库系统(Data Base System,DBS):指在计算机系统中引入数据库后的系统构成,一般由数据库、数据库管理系统、应用系统、数据库管理员构成。
数据库管理系统(Data Base Management System,DBMS):是位于用户与操作系统之间的一层数据管理软件,用于科学地组织和存储数据、高效地获取和维护数据。DBMS的主要功能包括数据定义功能、数据操纵功能、数据库的运行管理功能、数据库的建立和维护功能。
112数据管理技术的发展
1数据管理技术的发展
数据管理的水平是和计算机硬件、软件的发展相适应的,随着计算机技术的发展,数据管理技术经历了三个阶段的发展:人工管理阶段、文件系统阶段、数据库系统阶段。
(1)人工管理阶段。20世纪50年代中期以前,计算机主要用于科学计算。硬件方面,计算机的外存只有磁带、卡片、纸带,没有磁盘等直接存取的存储设备,存储量非常小;软件方面,没有操作系统,没有高级语言,数据处理的方式是批处理,也即机器一次处理一批数据,直到运算完成为止,然后才能进行另外一批数据的处理,中间不能被打断,原因是此时的外存如磁带、卡片等只能顺序输入。
人工管理阶段的数据具有以下几个特点。1数据库概论
本章主要介绍数据库系统的基本概念,包括数据库的基础概念、数据管理技术的发展过程、数据库系统的组成部分、关系数据库的规范化理论及数据库技术的发展趋势等。读者通过本章的学习,可以了解到为什么要使用数据库技术、如何使用数据库技术、数据库技术有哪些重要性等。
11数据库系统概述
数据库技术从20世纪60年代开始兴起,已有50余年的历史。所谓数据库是指长期储存在计算机内、有组织的、可共享的数据集合。而数据库管理系统是位于用户与操作系统之间的一层数据管理软件,它和操作系统一样是计算机的基础软件,也是一个大型复杂的软件系统。数据库是数据管理的最新技术,是计算机学科的重要分支。随着信息技术的发展,数据库管理系统已从专用的应用程序包发展成为通用的系统软件。由于数据库具有永久储存、较小冗余度、有组织、较高数据独立性和易扩展性等优点,许多庞大的信息系统都是以数据库为基础设计的。作为计算机学科的一个重要分支,数据库技术已被广泛应用于各行各业中,成为现代计算机信息系统和应用系统开发的核心技术和重要基础。
111数据库的基本概念
1信息与数据
在数据处理中,我们最常用到的基本概念就是数据和信息,信息与数据有着不同的含义。
(1)信息(Information)是客观事物存在方式或属性(状态)的反映。它反映的是关于某一客观系统中某一事物的某一方面的属性或某一时刻的表现形式。
具体地讲,信息是一种已经被加工为特定形式的数据,这种数据形式对接收者来说是有意义的,而且对当前和将来的决策具有明显的或实际的价值。
例如:“2020年生产量将提高10%”,对接收者有意义,使接收者据此做出决策。
(2)数据 (Data) 是反映客观事物属性的记录,是信息的载体。对客观事物属性的记录是用一定的符号来表达的,因此说数据是信息的具体表现形式。
可用多种不同的数据形式表示同一信息,而信息不随数据形式的不同而改变。
例如:“2020年生产量将提高10%”,其中的数据可改为汉字形式“二零二零年”“百分之十”。
数据所反映的事物属性是它的内容,而符号是它的形式。数据的表现形式多种多样,不仅有我们熟知的数字和文字,还可以有图形、图像、声音等形式。
(3)数据与信息的联系。数据与信息在概念上是有区别的。信息是有用的数据,数据是信息的表现形式。信息是通过数据符号来传播的,数据如不具有知识性和有用性则不能称其为信息。
数据是信息的符号表示或载体,信息则是数据的内涵,是对数据的语义解释。
例如:上例中的数据“2020”“10%”被赋予了特定的语义,它们就具有了传递信息的功能。
从信息处理角度来看,任何事物的属性都是通过数据来表示的;数据经过加工处理后,使其具有知识性,并对人类活动产生决策作用,从而形成信息。
用数据符号表示信息,其形式通常有三种:数值型数据,即对客观事物进行定量记录的符号,如体重、年龄、价格等;字符型数据,即对客观事物进行定性记录的符号,如姓名、单位、地址等;特殊型数据,如声音、视频、图像等。从计算机的角度来看,数据泛指那些可以被计算机接收并能够被计算机处理的符号。
数据和信息是密切相关联的,因此,在许多场合下,对它们不做严格的区分,可以互相使用。如通常说的“信息处理”与“数据处理”,“信息资源”与“数据资源”,“信息采集”与“数据采集”等具有同义性。
人们为了获取有价值的信息用于决策,就需要对数据进行处理和管理。
2数据处理
数据处理(也称信息处理)是将数据转换成信息的过程,包括对数据的收集、存储、加工、检索、传输等一系列活动。其目的是从大量的原始数据中抽取和推导出有价值的信息,作为决策的依据。
可用下式简单地表示信息、数据与数据处理的关系:
信息=数据+数据处理
数据是原料、是输入,而信息是产出、是输出结果。“信息处理”的真正含义应该是为了产生信息而处理数据。
3数据管理
数据管理是指对数据的收集、存储、加工、检索、传输等各种操作的总称,是数据处理的基本环节。
数据管理既是数据处理的基本环节,也是任何数据处理任务必有的共性部分。与其他技术的发展一样,计算机(电子)数据处理也经历了由低级到高级的发展过程。
4数据库与数据库管理系统
数据库(Data Base,DB):是长期储存在计算机内的、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。
数据库系统(Data Base System,DBS):指在计算机系统中引入数据库后的系统构成,一般由数据库、数据库管理系统、应用系统、数据库管理员构成。
数据库管理系统(Data Base Management System,DBMS):是位于用户与操作系统之间的一层数据管理软件,用于科学地组织和存储数据、高效地获取和维护数据。DBMS的主要功能包括数据定义功能、数据操纵功能、数据库的运行管理功能、数据库的建立和维护功能。
112数据管理技术的发展
1数据管理技术的发展
数据管理的水平是和计算机硬件、软件的发展相适应的,随着计算机技术的发展,数据管理技术经历了三个阶段的发展:人工管理阶段、文件系统阶段、数据库系统阶段。
(1)人工管理阶段。20世纪50年代中期以前,计算机主要用于科学计算。硬件方面,计算机的外存只有磁带、卡片、纸带,没有磁盘等直接存取的存储设备,存储量非常小;软件方面,没有操作系统,没有高级语言,数据处理的方式是批处理,也即机器一次处理一批数据,直到运算完成为止,然后才能进行另外一批数据的处理,中间不能被打断,原因是此时的外存如磁带、卡片等只能顺序输入。
人工管理阶段的数据具有以下几个特点。
目录
1数据库概论(1)
11数据库系统概述(1)
12数据库系统体系结构(6)
13数据模型(10)
14关系数据库(16)
15关系代数基础(20)
16关系数据库规范化理论(23)
17数据库技术发展现状与趋势(28)
本章小结(33)
习题(33)
2SQL Server 2008数据库基础(35)
21SQL Server 2008的数据类型(35)
22SQL Server 2008数据库的创建与管理(42)
23数据表的创建与管理(63)
24索引(86)
25视图(92)
本章小结(97)
习题(97)
3数据库设计(99)
31数据库设计概述(99)
32需求分析(100)
33概念结构设计(102)
34逻辑结构设计(106)
35物理结构设计(109)
36数据库的实施和维护(111)
本章小结(113)
习题(113)
4事务管理与并发控制(114)
41事务的概念及基本特性(114)
42DBMS对事务的并发控制(116)
43封锁(118)
44死锁和活锁(120)
本章小结(122)
习题(122)
5数据库安全性与权限管理(124)
51数据库的安全性概念及安全性控制措施(124)
52数据库备份和恢复(126)
53SQL Server 2008的安全管理(141)
本章小结(152)
习题(153)
6数据仓库技术(154)
61数据仓库的产生与发展(154)
62数据仓库的基本概念(157)
63数据仓库系统的体系结构(163)
64影响数据仓库成功的因素(166)
65数据仓库设计(168)
本章小结(176)
习题(176)
7数据挖掘概述(178)
71数据挖掘简介(178)
72数据挖掘的步骤(185)
73数据挖掘的相关技术与工具(187)
74数据挖掘系统的设计(191)
75数据挖掘的应用(193)
本章小结(196)
习题(196)
8关联分析(197)
81关联规则的基本概念(197)
82Apriori算法(201)
本章小结(205)
习题(205)
9聚类分析(207)
91引言(207)
92概述(207)
93聚类分析的算法分类(212)
94Kmeans算法(214)
95Kmedoids算法(218)
96离群点分析(221)
本章小结(222)
习题(222)
10分类(223)
101分类过程(223)
102决策树分类(225)
103贝叶斯分类算法(235)
本章小结(238)
习题(239)
参考文献(240)
温馨提示:请使用泸西县图书馆的读者帐号和密码进行登录