数据导入到ArcGIS的小技巧
ArcGIS假定,任何一张地图图层可以被影像校准(georeferencing)到地球表面上某一特定的地点。这种方法对于合并不同来源的空间数据十分强大和普适,然而,许多空间分析并不需要影像校准。利用比较考古学数据库中的数据,无论地理定位信息是否存在或准确,都可以进行如下分析:空间集群或分散、集中化、聚落层级化、网络关系、多个空间分布的相似性以及许多其它主题。比较考古学数据库中的大多数区域性数据集同样包括环境因素的信息,例如地形、水文、土壤以及其它资源。一个数据集中的这些不同地图图层可以恰当地相互进行影像校准,甚至于对精确地理定位受到广泛关注之前或在某些地区可行之前采集的数据集,也是如此。这些地理信息的数据集是内在统一的,而且自身不需要进行影像校准就可以进行分析。一些GIS程序(包括AutoCAD Map、GRASS、Idrisi以及其它)让分析变得十分简单,可以使用任何内在统一的坐标体系,而不管它们是否经过影像校准。然而,来自ArcGIS用户的疑问表明,许多人被ArcGIS对“所有地图图层应当经过影像校准”的坚持所困扰。正如下面要讨论到的,这个问题可以在ArcGIS中得以解决。即便是影像校准的元数据无法得到,这个目的仍然可以达到,这一点同样在下面有所讨论。以下的这些注释无意取代ArcGIS的说明文件,而仅仅是唤起对某些使用者可能并不知晓的ArcGIS相关工具的关注。
例如,通过在目录视图(Catalog Pane)中拖曳或者使用添加数据(Add Data)快捷键,一个.dxf文件可以被导入到ArcGIS中。忽略掉ArcGIS“空间信息丢失”的警告,继续进行。此时,AutoCAD的实体(entities)就出现在ArcGIS中目录表(Table of Contents)的图层组(Group Layer)文件下。AutoCAD的文本实体(Text entities)显示为ArcGIS的注释要素(Annotation features);AutoCAD的点实体(Point entities)显示为ArcGIS的点要素(Point features);AutoCAD的折线实体(Polyline entities)显示为ArcGIS的折线要素(Polyline features);AutoCAD的闭合折线实体显示为ArcGIS 的多边形要素(Polygon features)。ArcGIS要素的属性表(Attribute Tables)包含对应AutoCAD各种实体属性(例如图层、颜色以及其它)的变量。
如果影像校准的元数据可以获取到,这个信息可以被用来设置ArcGIS的数据组属性。这时很可能要求明确坐标体系、基准面(base datum)和地图单位(map units)。例如,在若干GIS程序中,ArcGIS是坚持使用“米”作为UTM投影体系单位的一个程序,而其它程序(包括AutoCAD Map、GRASS和Idrisi)则更加灵活,基于UTM的数据集经常可以使用“千米/公里”作为基本的地图单位。
对无法获取影像校准元数据或者元数据似乎不准确的地图而言,ArcGIS提供了非常好的工具可以对其进行影像校准。在影像校准(Georeferencing)和空间校正(Spatial Adjustment)工具条中可以找到这些工具。一些最强大和灵活的工具允许在未经过影像校准的地图上建立控制点(Control Points)以及告诉ArcGIS这些控制点在一个已知坐标体系的现实世界中的坐标。遗址、河流、高速公路、现代城镇等的确切位置常常包含在一个GIS数据集中。这些地方的坐标可以在基于WGS84基准面的UTM系统或经纬度(Lat/Long)中被确定,并且可以通过在某一个来源(例如Google Earth)中寻找这些地点。通过这种方式,一些控制点的坐标可以被精确地定位,影像配准从而可能有足够的精度允许其它来源、经过校准的数据进行叠加。在任何一个将不同来源数据进行叠加的实例中,聪明的分析者会坚持从视觉上判断空间匹配的精确程度(即当两个地图图层进行影像配准和叠加的时候,地图上的河流、高速公路或者其他可识别要素究竟匹配的怎么样?)。
如果目标分析并不包括将其它来源的空间数据进行叠加,而仅是要求在同一个数据集中保持内部的一致性。那么,应用上述方法,在ArcGIS中可以很方便地定位数据集在现实世界中的合适位置。为了追求高精准度而做出大量的投入并不必要。只要一个内部统一的GIS数据集的被导入要素被以相同的方式处理,那么这种内部的统一性就会被保留下来。
一旦空间数据被导入到ArcGIS中,利用导出数据(Export Data)选项,就可以生成一个向量文件(Shapefile)。如果含有AutoCAD实体属性的属性表(Attribute Table)不再出现,它可以被重新链接上。例如,利用ArcToolbox数据管理(Data Management)中的Feature to Point工具。
在一个.dxf文件中,多边形的标示符(identifiers of polygons)常常以AutoCAD文本实体(Text Entities)的形式出现,而这些文本实体的插入点(Insertion Points)就位于确立多边形的闭合折线的内部。当这样一张地图被导入到ArcGIS中时,多边形和它们的标示符之间的联系必须被重新确立。我们可以使用空间连接(Spatial Join)功能完成这个步骤。多边形所在的图层作为目标要素图层(Target Features layer),而AutoCAD文本实体所在的注释要素图层(Annotation Features layer)则成为连接要素图层(Join Features layer)。这个连接操作(Join Operation)叫做"一对一对应"(JOIN_ONE_TO_ONE). 一个新的含有多边形的图层会被创建,而它的属性表(Attribute Table)将包含字符串型的标示符(text-string identifiers)。
然后,这些标示符可以成为将其他数据表格(例如,以电子表格的形式)连接到多边形的基础。默认的情况下,一个由此生成的注释图层(Annotation layer)含有文本域(text fields),如果外在的数据表格含有数字域标示符,那么其中必须有一个被修改,因为ArcGIS将无法识别一个数字域和一个文本域之间的对应关系。如果要在ArcGIS中改变域(field)的类型,可以在表格中创建一个新的列及需要域的类型,然后根据已有标示符的域,使用属性字段计算器(Field Calculator)得到它们的数值。在连接数据(Join Data)对话框表格工具(Table)的连接属性(Join Attributes)里,外在表格这时就可以被连接到多边形。含有标示符的域必须同时被注释表格(Annotation Table)和外在表格(external table)选中。外在表格的列将被添加到注释表格中。之后,利用导出数据(Export Data)工具,整个结构可以被保存为一个向量文件(Shapefile)。