GIS历经60多年的发展,取得了巨大成功,已深度应用于社会经济环境协调持续发展的各行各业,已广泛服务于百姓大众而家喻户晓。
在人们对GIS技能和应用十分娴熟的情况下,即使是GIS专家和专业工程技术人员,恐怕也很难理直气壮地回答出GIS背后蕴含的数学基础知识和方法。在GIS快速发展和普及的同时,支撑GIS的基本数学方法的教育显然被忽视了、缺失了,这不能不说是个缺憾。而GIS数学方法一书的翻译出版,在某种意义上是对这种缺憾的些许弥补。
该书从数值和数值分析、代数、几何、平面及球面三角、微积分、矩阵行列式、向量、曲线和曲面、二三维转换、地图投影、基础统计、相关和回归、*优求解等方面以一种有趣的方式介绍了支撑地理数据处理背后的基本数学原理与方法,阅读该书可以让读者轻松掌握地理数据处理背后的规则和要求。该书有助于GIS教育的深入和持续发展,只有对支撑GIS的数学方法有较好的理解,才可能保证应用GIS得到可解释性更好的数据和更可靠的地理分析结果。
该书作者彼得·戴尔(Peter Dale)是伦敦大学学院(University College London,UCL)土地信息管理学教授,在土地测量、土地与地籍信息系统等方面有深厚的造诣。他是杰出的土地测量师,国际测量师联合会名誉主席,被誉为地理信息系统和测绘领域的伟大先驱之一,为支撑自然资源管理和土地管理技术的发展与应用做出过突出贡献。
第1章 地理信息的特征
1.1 地理信息和数据
通常认为,地理学是关于“地图”却又不同于“地图”的科学。毋庸置疑,地理学不仅覆盖这两个方面,而且内涵更丰富。归根结底,地理学可以定义为通过观察和测量来感知周围的世界、处理有关环境的数据,并将信息通过文本或者图像等方式呈现出来,达到理解客观世界的目的。需要强调的是,地理学尤其关注事物或对象究竟为什么会出现在它所在的特定地方,这是地理学的基本特点。
近年来,出版了许多有助于理解地理信息系统(geographic information system,GIS)的工具书。尽管对GIS的含义有各种各样的解释,但大多数人都愿意接受这样的定义,即GIS是在计算机硬、软件系统支持下,对具有地球空间参考的数据进行记录、管理、整合、运算、分析、显示的技术系统。这里的“空间参考”是指地球对象的位置,可以用测量数据加以描述;“数据”是对客观地球对象的记录,可以以某种方式测量并转化成信息。
“信息”是人们做决定时的参考依据。生活中需要面临很多令人困惑的问题。例如,一个人要从家到*近的购物商场就面临许多不同的路线选择,每一条路线都有自己的特征,如路上的坑洼、斜坡、转弯、转向和路口、路灯、井盖等。每条路线的所有特征都可以被测量和记录,但是大多数使用者真正想知道的是*短的路线是哪条。这一系列信息都可以从基础数据中获取。
术语“*短”有模棱两可的特点,因为它所表达的“*短”可以是时间方面,也可以是距离方面,这显然是不同的概念。所需收集数据的类型取决于信息的用途。期望得到的结果决定了所需要输入的数据类型,以及处理数据的方法。可以先从一组数据入手,看看从这些事实和数字中能领会到什么。通常,*有效的方法是借助图形来取得这些信息,尤其是地图和图表。倡导使用GIS的人们经常引用19世纪发生在伦敦的一个案例:把霍乱爆发的位置标注在地图上,然后清楚地看到感染者在被污染的水井旁边形成了一个集群。
当处理数据时,有两条黄金法则:一是质量差的数据,无论用什么好的处理方法,都会造成信息失真;二是质量好的数据,使用糟糕的处理方法也会造成信息失真。
如果数据可以被转化成优质信息,数据和处理方法也必须是高质量的,换言之,数据和处理方法应当是“适用的”或者是“使用安全的”。本书将着重讨论数据处理方法中所需的基本数学准则。
1.2 数据类型
数据本质上呈两种形态,即分类形态和数字形态。如同它们的字面意思一样,分类数据是指被放置在一个类别或者根据一个分类体系整理的数据。这些数据有时称为标定数据,它们是没有数值的。一个水果是苹果还是梨,或者其他,取决于对象本身及水果分类的方法。对于许多对象来说,都有着国际和科学的分类标准,尽管偶尔也会存在争议,例如,一个新的发现是归属于现有类的一个子类还是代表了一个全新的物种。
仅通过少量的数据来分类是不够科学的。例如,在一个特别的区域进行土地利用类型的划分,虽然每个国家都有全国土地利用分类系统,但这并不意味着所有记录土地使用的系统都遵循这个分类系统,而且每个国家不会使用相同的分类系统。一个建筑可能有多种不同的用途,例如,地下室用作体育场,第一层用作商店,第二层用于商务办公,顶层用于居住。关于建筑的使用应该如何分类,尽管有国家的条文规定,但是调查人员的意见可能仍然会产生分歧。本书的目的不是分析数据分类中的问题,而是为了强调这可能会是一个影响数据质量的问题。
一旦数据被归类,它们就可以进行对比参照,而无须量化。因此,数据可以按照一定顺序排列,例如,a比b大,b比c大,依此类推。这类数据被形容为序数,如一组优选数据(区域a相较区域b来说更适宜居住)。各种统计检验的存在就是为了处理和分析序数数据之间等级或顺序上的差异。这里不再对此展开讨论。
数据被归类后,通常需要指出它们的量级,可以利用离散变量或连续变量来实现。离散变量只能对特定点赋值,而连续变量是指数值连续渐变,允许在一定区间内任意取值。一些数据只能用完整数计量(称为整数,类似一个家庭中的全部孩子有多少个),而有些数据可以按连续量表取值(如每个孩子的身高)。当然,人们可以用十进制来表达平均每个家庭有2.54个孩子(详见第2章),即使不可能存在0.54个孩子。这种数据对于某些实际用途是有帮助的,尤其对于第12章谈到的关于可靠性估计问题。
离散变量是精确的并且经常被标识为整数(0,1,2,3, )。更具体地说,离散变量可以沿无中间值的刻度尺,以设定的间隔取一系列不同的值,此类数据通常称为区间数据(图1.1)。
图1.1 刻度尺
数据虽然有正有负,但这些值仅能基于它们之间的差异进行数量级的比较。只有在变量值为绝对值的情况下,才能得到关于它们相对大小的有效结论。例如,可以说一个拥有四个孩子的家庭与有两个孩子的家庭相比,绝对是两倍的关系,因为“0个小孩”是一个绝对的参考点。然而,在一个零刻度可以任意选择的温度计上,就不能简单地认为温度是的两倍。
*高水平的量测是比例量表,它与等距量表的不同之处在于,它有一个绝对的零点(如温度的绝对零点大约是)。绝对温度、长度和宽度都是用比例量表测量的例子。它们都是连续变量,并不局限于整数形式,而是可以在零到无穷大间取任何值。数量常表示一个可连续变化的量,如一条边的长度、一个区域的面积,是一个标准的计量单位(如米或平方米);数值则代表测量值与计量单位之间的比率大小。
地理数据有一个区别于其他数据形式的独特性质,那就是位置。地理数据可以被标注在地图上,并且可以用点、线、面来表示。从理论角度来说,点是没有维度的,线是一维的(长度),面有两个维度,体有三个维度。实际上,地图上的一个点是一个小圆块,或者由一条有宽度和方向的线形成的非常小的区域。每个点都有属性(即“是什么”),说明了某些性质或与其有关的性质,并且每个点都有位置(即“在哪里”)。如表1.1所示,当用户使用地图时,“是什么”可以被分类为例子中的点、线、面。
表1.1地图上的点、线、面
定义任何点的位置必须参考与其相关的点。*常用的参考系统是由标准尺寸大小格子构成的矩形格网。对于绝对的位置(区别于相对位置),格网必须有一个用于测量的起始点。点可能位于起始的*东边(或者是右边)和起始的*北边(或者页面的顶端);使用标准的计量单位得到的两个距离称为坐标系,或者更具体点来讲,称为笛卡儿直角坐标系。
在图1.2中,以原点为参考,P点在笛卡儿直角坐标系中的坐标是(x,y),在此图中表示为(6,5)。如果在原点上增加高程,就能扩展为三维坐标。虽然有些国家将x方向定为朝向北方或者向上方,但在本书中约定,以左下方的点为原点,页面横向为x方向,页面纵向为y方向(这与许多计算机软件图形包是相反的,它们一般是以屏幕左上方顶端点作为原点)。高程表示为z方向。任意一个三维对象点的坐标将表示为(x,y,z),在二维平面上,z=0。
图1.2 笛卡儿直角坐标系
可以用简单的数学方法分析在直角坐标系中的点的位置。有时使用不规则或扭曲的格网有助于问题的理解。例如,当试图在一张摊平的纸张上显示三维坐标时(图1.3),尽管遵循的基本准则相同,但数据操作会稍微复杂一些。
另一种可选择的方法是利用极坐标测量点的坐标位置(图1.4),通过原点相对于某些参考线的距离和方向来描述点。这里,方向称为方位,通常从北方向(或纸张的上方)沿顺时针方向测量。在图1.4中,P点相对于原点的极坐标为,d是距离,希腊字母(读作“theta”)是方向或者是相对于北方向的方位。
图1.3 不规则格网
图1.4 极坐标
角度和距离是在比率比例尺上量测的实例。距离通常表示为一个比率,例如,两点之间的空间距离与标准长度的比值。在国际单位制下,长度的标准单位是米,曾被定义为在巴黎保持恒温状态时铂棒上两个标记之间的距离。现在明确通过规定光速为每秒299792458m来定义。利用三角公式可以将极坐标转换成笛卡儿坐标(向东和向北或者x和y),反之亦然。
角度反映旋转量与完全旋转量之间的比率,它既可以表示为的任意一部分,每度可以分为60分,每分可以分成60秒;也可以用梯度表示,如400梯度,100梯度等于四分之一圈;或者用rad表示,是圆的直径与其周长之比。
角度测量很重要,在测量中位置可以用球坐标表示,正如地球是一个球体。一个点的纬度是其平行于赤道向南或向北的角度距离,通常用希腊字母“phi”或者表示;一个点的经度是相对格林尼治标准子午线的向西或向东的角度,通常用希腊字母“lambda”或表示(图1.5)。
任意点的海拔或高程是作为参考平面或表面之上的距离来测度的,该参考面是与地球的大小和形状*为近似的数学模型。球面点的坐标通常不用希腊字母表示,而是表示为()或者()。希腊字母的应用在数学中是很常见的。完整的字母表见表1.2。
图1.5 纬度和经度
表1.2 希腊字母表
为了更精确地测量,地球的形状被视为一个椭球,围绕其短轴旋转,而不是假设为一个理想球体(第4章讲述)。然而,在许多实际应用中,地球可以被看作一个球体。这里涉及两个重要词汇,一个词是“精确”,表示与地球形状的近似性,另一个词是“精度”,表示测量值的精确性,而不管该测量值正确与否。“精度”常用小数点的位数来描述,这代表了测量值精确到小数点后多少位,例如,距离2.105m比2m更精确,尽管后者可能更接近真实值。
在平面上,一条直线代表了两点之间的*短距离。在曲面(如球体)上,一条直线会发生弯曲,由于光在大气中的折射,视觉上弯曲得更为明显。对于后一种情况产生的结果本书不做处理。在第11章中,将考虑如何将曲面上的测量数据通过地图投影转化到平面上。在此之前,大地平面上进行的测量需要调整为合适的数学平面,称为球面或者参考椭球面,并使其能够近似于海平面。由平均海水面定义并假设其延伸到山脚下的平面称为大地水准面。在大地测量学中,测量的长度和计算出来的长度是有很大区别的。大地测量学是一门研究地球尺寸和形状的科学。图1.6描述了铅垂线(vv')表示的垂直方向可能没有通过地球中心这一实际点(线nn'垂直于数学平面A'B'),这是由于它受到附近地形的影响而发生偏移。稍后本书会讨论这些问题,现在把重点放在平面和二维表示上。
图1.6 直线的距离
GIS可以处理矢量的或者栅格的线对象。一方面,矢量是一种同时表示了方向和距离的量。本小节前文描述的极坐标就是一个矢量的例子。每一条直线都有长度和方向(如图1.7中的AB),一条曲线可以被看作由一系列直线或者矢量组成的。在第8章中将对矢量对象进行更加详细的讨论。另一方面,一条线也可以看作由一系列有限尺寸的点相互连接起来组成(图1.8)。电视屏幕或者点阵打印机上的曲线,在人们眼中也许十分平滑,但是实际上都是由网格上的一系列点组成的。这样的表现手法称为栅格影像,每个小方格称为一个像素。
图1.7 矢量线
图1.8 栅格影像中的线
栅格影像可以用来表示线或者面。栅格数据的处理对于电脑来说是简单的,但是需要大量的计算机存储空间。一个面积为20cm×20cm的单位网格或者每厘米100点的单元(分辨率0.1mm)就需要一个400万字节的可用存储空间。而对于用矢量表示的一条直线段而言,仅需
目录
译者前言
第二版前言
第一版前言
第1章 地理信息的特征 1
1.1 地理信息和数据 1
1.2 数据类型 1
小结 8
第2章 数值和数值分析 10
2.1 运算规则 10
2.2 二进制系统 13
2.3 平方根 15
2.4 指数和对数 16
小结 21
第3章 代数:把数字当作符号 23
3.1 毕达哥拉斯定理 23
3.2 相交线的方程 24
3.3 多边形上的点 29
3.4 平面的方程 30
3.5 进一步的代数方程 30
3.6 函数和图表 34
3.7 插入中间值 36
小结 39
第4章 常见的几何形状 41
4.1 三角形和圆 41
4.2 三角形的面积 43
4.3 三角形的中心 46
4.4 多边形 48
4.5 球体和椭圆 50
4.6 圆锥曲线 51
小结 55
第5章 平面与球面三角形 57
5.1 基本三角函数 57
5.2 钝角 60
5.3 和角 62
5.4 方位与距离 64
5.5 球面角 67
小结 70
第6章 微积分 73
6.1 微分 73
6.2 三角函数的微分 76
6.3 多项式函数 78
6.4 线性化 81
6.5 积分 84
6.6 面积与体积 86
小结 90
第7章 矩阵和行列式 92
7.1 基本矩阵运算 92
7.2 行列式 95
7.3 相关矩阵 98
7.4 应用矩阵 103
7.5 旋转和变换 104
7.6 简化矩阵 110
小结 114
第8章 向量 116
8.1 向量特点 116
8.2 点积和叉积 119
8.3 向量和平面 122
8.4 入射角 124
8.5 向量和旋转 125
小结 128
第9章 曲线和曲面 129
9.1 参数形式 129
9.2 椭圆 132
9.3 曲率半径 135
9.4 拟合曲线 136
9.5 贝塞尔曲线 141
9.6 B-样条曲线 143
小结 145
第10章 二维三维转换 147
10.1 齐次坐标 147
10.2 旋转对象 148
10.3 隐藏线和面 155
10.4 摄影测量 157
小结 159
第11章 地图投影 160
11.1 地图投影 160
11.2 圆柱投影 162
11.3 方位投影 166
11.4 圆锥投影 168
小结 174
第12章 基础统计 176
12.1 概率 176
12.2 集中趋势测量 178
12.3 正态分布 182
12.4 显著性水平 184
12.5 t-检验 186
12.6 方差分析 188
12.7 卡方检验 191
12.8 泊松分布 192
小结 193
第13章 相关和回归 196
13.1 相关 196
13.2 回归 200
13.3 权重 203
13.4 空间自相关 204
小结 206
第14章 *优解 208
14.1 *小二乘法解 208
14.2 测量修正 212
14.3 卫星定位 220
小结 226
延伸阅读 227
温馨提示:请使用泸西县图书馆的读者帐号和密码进行登录