对空间数据不确定性研究的思考
作为地理空间信息的一个理论问题,国内外对空间数据不确定性研究已经开展了若干年,也取得了许多成果。我们参加了一些相关的研讨会,也阅读了有关的研究论文,总觉得还有一些十分基础的问题需要讨论和进一步明确。我愿意将个人的一些思考写出来,供GIS业界讨论。
1 要区分GIS中确定性目标与不确定性目标
GIS是采集、处理、存储、管理、发布和应用与地理空间分布有关目标及其环境的计算机信息系统。GIS中的地物目标(Object)大体上可分为天然目标和人工目标。它们之中有许多确定性目标,如一个体育场、一栋房子。它们的面积是确定性的,不同的人用不同的仪器去量测(统计取样)会得到不同的面积量测值。从理论上,讲无穷次量测将能得到其真值,有限次量测是对真值的估值。对于这些目标几何的特性,可用最小二乘法、稳健估计法等统计数学方法去研究量测值、平差值和平差值函数的精度和可靠性,而不应当将它们称为不确定性研究。与之相反,GIS中的许多自然目标,如海岸线、河流岸线、地表形态(DEM)、火山口的边界、天然林与草地的边界等,它们有分形特征,表现为不满足处处连续光滑和各向同性,而呈现出处处不可微分的特征,因而是不确定性目标。对这些目标几何特性的研究除了近似地用统计数学方法外,也可以用分形数学、模糊数学、粗集理论和集统计与模糊数学为一体的云模型理论等数学方法来处理。
2 要区分用离散点逼近复杂曲线和曲面的逼近误差与离散点自身的量测误差及其传播
电子计算机问世和电子地图出现后,为了在计算机中存储和管理复杂地物目标,人们提出用离散点串来描述点线面体各类空间目标。一个十分突出的问题是如何用离散点组来逼近复杂曲线与曲面。在20世纪80~90年代,对于用离散点来逼近曲线、曲面的方法和精度曾有过很广泛而深入的讨论,已发表了大量论文。以DEM为例,曾有ITC马卡洛维奇提出的采样点由少到多的渐近取样法和德国阿克曼教授提出的从高密度影像匹配结果中逼近地形分析由多到少的金字塔方法(AcKermann,et al,1992)。现在的研究应当认真去借鉴当年的研究成果。
图1中,点1、点2、点3表示GIS中离散点对真实地形表面的逼近,显然,ΔM为离散点逼近曲线的最大误差。点1、点2为量测值,它们有一定的量测误差。点1、点2的量测误差对点M的影响可由误差传播定理求出,但与曲线的逼近误差是两种不同性质的误差,不应当混淆,更不应当将离散点量测误差的传播理解为曲线和曲面在GIS中表达的误差。
图1 曲线逼近误差
3 要研究GIS中的几何不确定,更要重视研究如何处理属性(语义)和时态不确定性
与测绘相比,GIS包含几何信息和非几何信息,它要回答的问题更加广阔,更加复杂。例如,GIS要回答国家提出的诸如我国公路铁路的总长度这一几何问题。一般来说,道路是由航片或卫星像片上识别和提取的,其精确度不仅仅取决于量测线路长度的几何误差,更要重视属性(语义)不确定性的误差,如将影像上的水渠当作道路或将道路误辨为水渠。后者产生的影响要大得多。又例如,中国的耕地面积总数这个几何问题,它不仅取决于一块块耕地面积量测的精度,更取决于土利用分类中的错误(属性不确定)和随着时间的土地利用变化。耕地已改变其原属性而改作建筑用地或退耕还林、退田还湖这类时态不确定导致的影响,它们对总面积是否精确产生的影响要比几何量测误差的影响大得多。因此,要开展GIS中时态不一致和属性(语义)不一致的研究,研究出语义同化和时态同化的方法(Li,2005)。
4 要研究空间数据的质量(QoD),更要重视空间信息服务的质量(QoS)
在以往的研究中,人们较多关注空间数据的质量(QoD)。但是当今的GIS已进入Web-GIS、Mobile-GIS和GRID-GIS(李德仁,2005),因此,我们应当把研究从数据的质量扩展到空间信息服务质量的新阶段。网络GIS空间信息服务的质量在于用最短的时间、最少的成本,把最有用的信息送给最需要的人。从这个意义上讲,网络GIS服务的质量是多种因素决定的,包括:
1)系统对用户的空间服务要求的理解水平;
2)空间信息服务语义模型的质量;
3)任务分配所选用数据和算法的质量;
4)网络通信的质量、速度与完好性;
5)空间信息服务在用户终端上实现方法特别是可视化的质量等。
所有这些与空间信息服务有关的方面都需要我们去研究(Wu,2004)。
5 空间数据不确定性研究要努力朝实际应用转化
空间数据质量研究,不论是20世纪60年代开展的精度研究,还是20世纪80年代开展的可靠性研究和可区分性研究,都是坚持理论与实际相结合的原则。研究成果均向实际应用及时转化,从而提出了补偿系统误差、剔出粗差的多种实用算法。通过平差系统的精度和可靠性分析,对各类测量系统的布设也提出了应遵循的原则。
与之相对比,目前GIS中空间数据不确定研究一直未脱出纯理论和纯函数表达式的阶段。问题的研究尽管愈来愈复杂,但仍看不出实际应用的具体方法。在2005年北京召开的ISPRS工作组研讨会上甚至有外国学者提出了“空间数据不确定性研究的不确定性”的命题。所以,如何将当前的空间数据不确定的各种表达式的分析结果变为用户可操作的确定性标量(如最大风险值、平均风险值等),使用户得到空间数据质量和空间信息服务质量的确定性指标,使土地购买者得到其确定的风险大小值,这样才可能使空间数据不确定性研究走向实用。
6 结语
以上的五点思考旨在推进当前GIS中空间数据不确定性研究朝更加宽广、更加实用的方向前进。阿克曼教授在20年前就曾说过:“理论研究在于解决实践中提出的问题。”只有解决了实际问题,理论研究才能真正落到实处。
参考文献
[1]Ackermann F,Schneider W.Experience with automatic DEM Generation[C].International Archives of Photog&RS,Washington D C,1992.
[2]Li Deren.Is Geo-Service Ready—On Generalized and Specialized SIG[C].ISPRS Hangzhou Workshop“Service and Application of Spatial Data Infrastructure”,Hangzhou,2005.
[3]李德仁.论广义空间信息网格和狭义空间信息网格[J].遥感学报,2005,9(5): 513-519.
[4]Li Deren,Wu Huayi.A Raster Based Map Information Measurement for QoS[C].ISPRS’2004,Turkey,Istanbul,2004.
(测绘科学技术学报,2006,23(6))
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。