首页 理论教育 论地图数据库合并技术

论地图数据库合并技术

时间:2023-03-04 理论教育 版权反馈
【摘要】:参与合并的源数据库是矢量型的,而不是栅格型的。因此,本文认为,地图数据库合并的研究范畴主要限定于相同或相近比例尺之间的数据库。由此可以看出,地图数据库合并技术是空间数据库集成技术的一个子集,它侧重于解决矢量地图数据库之间的垂直集成问题。从这个意义上来说,地图数据库合并也是空间信息融合的研究范畴。因此从数据处理的目的而言,地图数据库合并与地图综合是不同的。

论地图数据库合并技术

1 引  言

地图数据库合并(Conflation of Geographic Databases)或者地图合并(Map Conflation)技术在解决空间数据的垂直集成以及基于特征的空间信息融合问题方面显示了它独特的优势,被认为是空间数据采集和集成技术中的核心技术之一[Saalfeld,1996;Goodchild,1996;Walter and Fritsh,1999]。地图数据库合并是指由同一地区两个或两个以上不同来源的地图数据库生成一个新的更好的地图数据库[Cobb et al,1998]。在同名实体匹配的基础上,通过实体图形和属性数据的合并,新生成的地图数据库全部或部分地集成了两个源地图数据库的优点,如点位精度高、属性信息丰富、现势性好等。地图数据库合并技术除了可以用于空间数据库的集成和信息共享外,还可以应用于同一地区两个不同来源地图数据库之间的图形配准,差异分析和质量评价,并且还可以用于地图数据库的局部变化检测和自动更新。

国外已有不少学者对地图数据库合并的相关技术进行了研究[Saalfeld,

1988,1993;Cobb et al,1998,2000;Filin and Doysther 1999,2000;Walter and Fritsh 1999;Lemarie and Ravnal,1996],也有不少实际应用的例子[GIS/ Trans Ltd.,1995;ESEA Inc.;Cowen et al,1996;Dallal,1998],商业化GIS软件供应商也开始提供为地图数据库合并服务的功能或模块,如ESRI、Integraph,GDT等,但是关于地图数据库合并本身的一些基本问题还研究得比较少,这些问题包括:地图数据库合并技术的研究范畴和研究内容是什么?地图数据库合并技术与其他已有技术的关系如何?地图数据库合并技术的一般数据处理流程是怎样的?本文旨在已有研究的基础上试图回答以上问题,以建立地图数据库合并的基本理论和技术框架。

2 地图数据库合并技术研究的范畴

地图数据库合并技术研究的范畴可表示为图1。从图1可以看出,地图数据库合并技术的研究范畴包括:

(1)参与合并的两个源数据库是同一地区的,或者至少是有部分是同一地区的(如相邻区域地图数据库的拼接)。

(2)参与合并的源数据库是矢量型的,而不是栅格型的。对于源数据库是栅格影像的情况,也可以在完成从影像上提取特征之后(也就是转成矢量型地图实体之后)参与合并。

img43

图1地图数据库合并技术研究的范畴

(3)参与合并的两个源数据库的比例尺是相同的或者是相近的。相近的比例尺是指在国家地图制图比例尺系列中相邻的比例尺,如1∶10 000或1∶5 000,或者1∶2 000和1∶5 000。虽然,从实际应用来讲,要合并的两个源数据库的比例尺也可能会相差很大,但是总的来说,这种应用需求是少量的和偶然的,另一方面,在比例尺相差得更大时,地图数据库的合并要考虑的因素比较多,能用它来解决的问题是有限的。因此,本文认为,地图数据库合并的研究范畴主要限定于相同或相近比例尺之间的数据库。

(4)参与合并的两个数据库具有相同或相近的时相,也就是说,两个数据库在时间上的跨度不是很大,如小于该地区地图更新周期(据有关部门确定或具体应用要求)的1/2。如果两个地图数据库时间跨度很大,同名实体匹配成功率则会很低,从而难以进行合并处理。

(5)参与合并的两个源数据库已经消除了相互之间的系统差,主要是投影系统、坐标系统以及测图控制网之间的差异,这可以通过一般的投影变换、坐标变换(如仿射变换)等进行统一或修正,通常这种变换是在已知数学模型的基础上来实现的,在有些情况无法确认坐标转换的数学模型,则也可以通过两个源数据库的同名点来实施。这些坐标变换和地图合并中的几何位置调整的区别在于前者是针对所有的图形实体的,而后者只是局部调整,通常是分块局部拓扑同胚变换(Piecewise Loeal Homeomorphisms,PLH)。

(6)参与合并的源数据库已经是经过形式一致化和逻辑规范化了的。比如,消除了数据存储格式的不一致性,不同的数据格式已经进行了转换和统一;消除了同一地物要素类实体的表达类型的差异,若同一地物要素(如建筑物)在一个数据库是线实体类型;另一个是面实体类型,则应先进行实体类型的转换(如将线实体转换成面实体);消除了数据拓扑关系的不规范性,比如没有多余的实体,没有不合理的连线,没有“伪结点”等。这些工作大部分可以通过已有GIS工具软件来实现。

(7)参与合并的两个源数据库各有优点,或者点位精度相对较高,或者属性信息丰富,或者现势性比较好,或者详细程度、数据完整性比较好,也就是说,参与合并的两个地图数据库都是不能完全丢弃的。如果两个源图中其中的一个图没有什么优势,就没有合并的必要了。

3 地图数据库合并技术与其他已有技术的关系

虽然在纸质地图时代,人们在进行地图编绘作业时就开始关注同一地区不同来源地图的叠合问题,但是在数字地图环境下或者在GIS环境下的地图合并技术的研究始于20世纪80年代,到90年代该技术才开始走向应用。因此相对来说,它还是一项新的技术,下面简要分析它与其他已有相关技术的区别和联系。

3.1 地图数据库合并与空间数据库集成

空间数据库的集成包括水平集成(相邻地区数据库的合并)和垂直集成(同一地区数据库的合并)两种[saalfeld,1996];从集成的数据源类型来看,它包括了影像与影像、影像与矢量地图、矢量地图与矢量地图之间的数据库集成,有时也包括这些数据库与GPS数据之间的集成[Goodchild,1996]。由此可以看出,地图数据库合并技术是空间数据库集成技术的一个子集,它侧重于解决矢量地图数据库之间的垂直集成问题。

3.2 地图数据库合并与空间信息融合

简单地说,空间信息融合就是把不同来源的空间数据或信息加以联合、相关和组合,以获得信息量更丰富或更适于处理、分析、决策的新的空间数据集的过程。从这个意义上来说,地图数据库合并也是空间信息融合的研究范畴。地图数据库的合并问题属于第二层次即特征级的空间信息融合间题。

3.3 地图数据库合并与地图自动综合

地图综合的主要目的是为了由大比例尺地图设计制作小比例尺地图作品。因此从数据处理的目的而言,地图数据库合并与地图综合是不同的。但是在进行不同比例尺地图数据库合并时我们必须考虑比例尺的影响或者考虑制图综合的影响。在某些方面,比如空间实体的相似性度量、形状描述、邻近性分析等方面两者有很多相通之处,因此两者又可以相互借鉴有关的理论和方法。

3.4 地图数据库合并与地图更新

当两个源数据库具有不同的时相时,通过同名实体的匹配,地图数据库合并技术可以解决地图局部的少量变化检测和自动更新问题。比如对城市大比例尺地图数据库维护部门来说,地图修测补测是他们的日常工作之一,如何有效、方便地将新测的局部数据融入到已有的地图数据库中去,是他们非常关心的问题。而地图数据库自动合并技术可以为他们提供一种有力的技术手段。但是地图数据库合并技术解决地图的更新问题的能力是有限的,对于大范围的地图更新和变化检测,还要依靠摄影测量与遥感等其他技术手段。

3.5 地图数据库合并与地图叠置操作

地图数据库合并与GIS中常用的地图叠置(Map Overlay)操作都是考虑同一地区不同数据源之间的垂直叠加问题,因此两者在概念和方法上有些相通之处。它们的主要区别在于:前者考虑了源数据库中可能存在的数据不一致性。这个不一致性可能是同一地物在不同图上位置、几何形状、拓扑关系、属性数据等方面的不一致,也可能是这个图上有这个地物,另一个图上没有相应的地物。另一方面,地图叠置要生成交点,并生成新的多边形,而地图数据库合并只是将匹配地物的不同表现形式一致化。从数据处理对象来说,地图叠置操作通常是在同一地区不同的图层也即不同的地物要素实体中进行的,而地图数据库合并则主要针对同一地区相同图层中即相同的地物要素中进行。

4 地图数据库合并技术的研究内容

地图数据库合并技术的研究才开始起步,还有许多相关的理论和技术问题需要去深入研究和解决。一些学者讨论了地图数据库合并的研究内容[Goodchild,1996;Saalfeld,1996]。本文在综合已有研究的基础上将当前地图数据库合并,还需要进一步深入研究的问题并归纳如下:

(1)数据结构和数据模型问题:适宜于同名实体匹配的空间数据结构以及能保存实体合并前信息的空间数据模型应该是什么样的?

(2)语义问题:如何克服不同语义模型之间的差异对实体匹配的影响,与几何、拓扑信息相比,语义信息在实体匹配和合并过程中有什么作用?同名实体匹配完成后,如何实现属性数据的转换或合并?

(3)数据质量问题:如何根据同名实体评价两幅图之间的相对精度;合并后新图的数据质量又如何评价?

(4)可视化问题:如何将匹配或合并结果直观生动地表达出来,并将结果中最重要的信息转达给用户?

(5)自动化和智能化问题:如何在同名实体匹配与合并过程中尽可能地减少对用户人工干预的依赖?如何尽可能地模拟制图专家在地图编绘过程中所体现出来的创造性劳动?

(6)分布式处理的问题:在分布式环境中如何实现地图数据库的合并,如何解决可能存在着的模式(元数据)的集成问题?

(7)应用问题:需要应用地图数据库实体匹配与合并技术来解决的问题有哪些,应该采取的策略是什么,有没有通用的解决方法?

5 地图数据库合并的一般数据处理流程

地图数据库的合并一般包括如下四个过程:一是数据预处理;二是同名实体的匹配;三是图形数据的合并;四是属性数据转换或合并(图2)。其中数据预处理,主要是两个地图数据库的数据规范、存储格式以及同类地物实体类型的统一、全局坐标变换、拓扑关系建立、空间实体索引等。第二步中包括同名点匹配、同名线实体匹配以及同名面实体的匹配,这一步的目的是通过一系列的空间实体相似度指标,识别出同一地区不同来源地图数据库中同一地物(集)的图形实体(即同名实体),从而建立两个地图数据库之间同名实体之间的联接。第三、四步是地图数据库合并的目的,主要是相关实体的图形配准和协调以及属性数据的转换和合并,从而得到一个新的更好的更适宜于应用的地图数据库。

6 地图数据库合并中的同名实体匹配技术

同名实体(Identical Entity/Counterpart Element)是指两幅图或两个地图数据库中反映现实世界同一地物(集)的空间实体(集)。同名实体在不同来源的地图中通常都存在着差异,这种差异是由于制图误差,不同应用目的或不同的人的解释差异以及制图综合等因素的影响而产生的。图3示意了不同来源地图数据库同名实体之间可能存在的差异,图3(a)中虚线为1∶100 000道路实体,实线为1∶24 000道路实体;图3(b)中虚线为1∶500房产图建筑物实体,实线为1∶500地形图建筑物实体。

img44

图2 地图数据库合并数据处理流程

img45

图3 不同来源地图同名实体可能存在的差异

同名实体的识别或匹配就是在分析不同来源地图数据库之间差异的基础上,通过一系列的空间实体相似度指标识别出不同来源地图数据库中表达现实世界同一地物(集)的实体(即同名实体)的过程。它是地图数据库合并的关键技术之一。同名实体匹配的依据包括距离量度、几何形状、拓扑关系、图形结构、属性信息等。同名实体的匹配是一个复杂的过程,需要用到几何学、统计学、计算机视觉、模式识别、人工智能和专家系统等领域的理论和方法。同名实体匹配的结果既可以用于两个地图数据库之间的局部图形配准,也可以用于差异分析和质量评价,还可以在此基础上进行图形和属性数据的合并,实现两个地图数据库之间的集成和信息融合。同名实体的匹配包括同名点匹配、同名线实体匹配以及同名面实体的匹配。限于篇幅,关于地图数据库合并中的同名实体匹配技术更详细的论述将另文介绍。

7 地图数据库合并技术应用实例

图4示意了大比例尺城市地图合并的部分结果,其中虚线图为1∶500房产图,实线图为1∶500地形图,根据元数据信息知地形图的现势性比房产图强,

img46

图4 地图数据库合并结果示例

且点位精度也比房产图高。图4(a)阴影显示的是在同名点匹配的基础上房产图建筑物实体局部配准的结果,从图中可以看出,配准后房产图中的建筑物实体更接近地形图中相应的同名实体,由于地形图的点位精度高,因此合并后的房产图点位精度得到了提高。图4(b)显示的是通过同名面实体匹配检测出房产图的局部变化,在此基础上进行地图的局部更新。其中建筑物1和3为新增图形实体,建筑物2为消失实体。通过地图数据库合并技术,还实现了房产图中建筑物实体丰富的属性数据转换到地形图或地籍图相应的同名实体中,从而达到不同来源地图数据库之间的信息共享,限于篇幅属性数据合并结果不再列出。

8 结语

空间数据的采集和集成是当今地理信息系统(GIS)研究的前沿课题,地图数据库合并技术则是其中的核心技术之一。同一地区不同来源地图数据库的合并或集成将受到越来越多的GIS研究和应用部门的重视。本文探讨了地图数据库合并技术的一些基本问题,这些问题的研究丰富和完善了地图数据库合并技术的基本理论体系,对建立地图数据库合并的主要技术框架有着重要的意义。相信随着有关理论和技术问题的不断研究,地图数据库的合并技术必将为空间数据库的集成与信息融合以及地理信息科学的发展作出有益的贡献。

参考文献

[1]Cobb M,Chung M,Foley H.A rule-based approach for the conflation of attributed vector data[J].Geoinformatica,1998,(1):7-35.

[2]Cobb M.Intelligent database agents for geospatial knowledge integration and management[DB/OL].http://sdiagent.st.usm.edu/default.asp,2000.

[3]Cowen D J,Shirley L,Jensen J.The update and maintenance of TIGER files from other data sources[DB/OL].http:/www.geog.buffalo.edu/ucgis/nres-pri/socar-a.html,1996.

[4]Dallal S L.Automated attribution of shapefile data through map merging[DB/OL].http:// www.esea.com/software/p306.html,1998.

[5]ESEA Inc.Conflation FAQ[DB/OL].http://www.conflation.com/conflati.htm.

[6]Filin S,Doytsher Y.A linear mapping approach to map conflation:matching of polylines[J].Surveying and Land Information Systems.1999,59(2):107-114.

[7]Filin S,Doytsher.Y.A liner conflation approach for the integration of photogrammetric information and GIS data[A].In:ISPRS[C],2000,Vol.33,Amsterdam:(http:// www.geo.tudelft.nl/frs/staff/sagi/pub/ISPRS2000-filin-doytsher-paper-528.pdf).

[8]GIS/Trans Ltd.Comprehensive GIS conflation[M].GIS/Trans Ltd.White Paper,1995.

[9]Good child M F.Conflation:combining geographical information[DB/OL].http:// www.ncgia.ucsb.edu/researeh/ucgis/proposal.html,1996.

[10]Lemarie C,Raynal L.Geographic data matching:first investigations for a generic tool[A].In:Proceedings of The GIS/LIS'96 Annual Convention[C],Denver,Colorado,USA:1996:333-341.

[11]Saalfeld A.Conflation:automated map compilation[J].IJGIS,1998,2(3):217-228.

[12]Saalfeld A.Automated Map Conflation[D].Dept.of Computer Sci.,The Unversity of Maryland,Washington D.C.,USA,1993.

[13]Saalfeld A.Spatial data acquisition and integration[DB/OL].http://www.ncgia.ucsb.edu/ other/ucgis/research-priorities/old3%20%287-07-97%29/acquisition.html,1996.

[14]Walter V,Fritsh D.Matching spatial data sets:a statical approach[J].IJGIS,1999.13(5):445-473.

(合著者:龚健雅张桥平)

(测绘科学,2004,29(1))

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈