La Base de Datos para la Arqueología Comparativa intenta presentar datos de diferentes proyectos en un formato relativamente consistente al mismo tiempo que reconoce que la arqueología involucra una variedad extremadamente amplia de tipos de datos, y que los arqueólogos han empleado, tradicionalmente, muchas formas diferentes de organizar sus datos. Ante esta situación, la Base de Datos para la Arqueología Comparativa no intenta imponer estandarización sobre los archivos de los diferentes conjuntos de datos. Un cierto número de estos incluye elementos enteramente únicos, los cuales hemos tratado de presentar de maneras inventivas que aprovechen la presentación digital en línea, con organización intuitiva que no requiera de una explicación por separado. Hay también ciertos tipos recurrentes de elementos que intentamos tratar consistentemente. Hemos escogido varios formatos estándares de archivos que se pueden importar a una gama amplia de programas de análisis, y que estimamos que van a seguir siendo formatos ampliamente usados en el futuro. Adicionalmente hemos tratado de presentar los metadatos de una manera consistente en lo posible.
Datos de Casos y Variables
Los datos cuantitativos frecuentemente toman la forma de casos codificados para una serie de variables. Tales archivos de datos se presentan como tablas en cuyas filas están los casos y en las columnas están las variables, según suelen organizarse en los programas de análisis estadístico. El archivo de texto delimitado por comas es un formato tipo mínimo común denomidador para tales archivos. La extensión de archivo usual es .csv o .txt. Estos archivos pueden leerse con casi cualquier programa que haya sido escrito para lidiar con tales datos, y este formato se usa de manera consistente en los datos presentados en la Base de Datos para la Arqueología Comparativa. Siempre mostramos y explicamos la primera línea de estos archivos para ayudar a los usuarios a evitar errores en su interpretación y errores de programa al importarlos. Los elementos centrales de los metadatos para tales archivos incluyen una indicación explícita de cuáles son los casos (filas) y una lista de las variables (columnas) con cualquier explicación necesaria para entender el contenido de la tabla. Los nombres de las variables no se incluyen en las primeras líneas de estos archivos de texto separados por comas, como a veces se hace, ya que las convenciones para los nombres de variables varían mucho a través de los diferentes programas de análisis de datos. Los usuarios necesitarán referirse a los metadatos y crear sus propios nombres de variables en concordancia con los requerimientos del programa que estén usando. En muchos conjuntos de datos, tales datos también pueden descargarse en formato para hoja de cálculo, que son aún más fácil de explorar (inclusive con software de código abierto como OpenOffice).
Georreferenciación de Datos Espaciales
Los datos espaciales presentan varias complejidades en particular. Una de ellas es la georreferenciación. Muchas de las recolecciones de datos arqueológicos se llevaron a cabo, obviamente, antes de que la georreferenciación global se estandarizara y antes de que el uso de equipos de GPS se generalizara. A escalas pequeñas (tales como ubicaciones sobre una superficie de vivienda o dentro de un sitio), lo que importa es la posición espacial relativa, y el uso de sistemas de coordenadas no georreferenciadas ha sido común, y continua siéndolo. En efecto, lo mismo es cierto, frecuentemente, para escalas más grandes (regionales), aunque los equipos de campo con base en GPS puedan recolectar datos en sistemas de coordenadas georreferenciadas, y algunos programas de SIG asuman automáticamente que los sistemas de coordenadas están georreferenciados, requiriéndose un esfuerzo adicional para trabajar con un sistema arbitrario de coordenadas, si la georreferenciación no es útil.
La naturaleza de la información georreferenciada disponible varía de un set de datos a otro, dependiendo de cuándo, dónde, y cómo se recolectó la información espacial. A medida que los datos ambientales georreferenciados aumenta en cantidad, disponibilidad, y mejora en resolución, también aumenta la tentación de superponer distribuciones de asentamientos arqueológicos a escala regional sobre información ambiental de varias clases disponible más recientemente. Para los datos de escala regional en la Base de Datos para la Arqueología Comparativa, se ha hecho un esfuerzo de ser explícitos sobre los sistemas de coordenadas usados para los datos espaciales, y para proveer información que pueda ser útil para su georreferenciación. Como es siempre el caso cuando se intenta superponer datos espaciales de diferentes fuentes, el usuario deberá usar precaución extrema al revisar que los datos de diferentes fuentes estén sobrepuestos apropiadamente antes de proceder con cualquier forma de análisis. Una manera de hacerlo, por supuesto, es determinar si rasgos fácilmente visibles en las diferentes fuentes (como arroyos, carreteras, u otros rasgos topográficos) concuerdan en la superposición. Todos los programas de GIS de buena calidad proveen herramientas para registrar apropiadamente datos de diferentes fuentes emparejando rasgos compartidos, sea que los metadatos acerca de los sistemas de coordenadas estén disponibles o no. Sin duda alguna, estas herramientas producirán mejores resultados (datos espaciales más exactos y confiablemente registrados) que superponer varias capas "automáticamente" con georreferenciación incorrecta o con metadatos imprecisos.
Dibujos de Vectores
La información espacial en formato vectorial en la Base de Datos para la Arqueología Comparativa usualmentee provee como archivos .dxf de AutoCAD Edición 12. Este formato puede ser importado a una amplia variedad de programas para gráficos y SIG. Es un formato nativo de AutoCAD Map; por lo tanto, no es necesaria su "importación" a este programa, y su estructura será familiar para los usuarios de AutoCAD Map. Las estructuras y vocabulario de los datos, sin embargo, difieren pronunciadamente entre programas de SIG. Los diversos programas varían sustancialmente en su habilidad para detectar y utilizar correctamente la información georreferenciada integrada en archivos .dxf para AutoCAD Map. Por esta razón, la mayoría de los archivos .dxf en la Base de Datos para la Arqueología Comparativa no contienen información georreferenciada integrada, sino que esta información se provee como parte de los metadatos. Aquel usuario que necesite datos arqueológicos georreferenciados debe entonces prestar atención especial al contenido de la información georreferenciada disponible y saber cómo usarla correctamente en el programa al cual se importa un archivo .dxf. En vista de que, al momento, muchos arqueólogos usan ArcGIS, se proveen algunas sugerencias para importar datos a ArcGIS. Para ciertos sets de datos, encima de los archivos .dxf, también se provee la misma información espacial en los formatos originales usados por sus autores.
Imágenes Raster
La información espacial en formato ráster se provee usualmente como archivos GeoTiff. La información georreferenciada siempre está integrada en estos archivos .tif, asi como en sus archivos .tfw acompañantes pero separados. Algunos programas de SIG georreferencian archivos GeoTIFF al momento de importar, de acuerdo con la información insertada, y no usa el archivo .tfw. Otros programas se apoyan en el archivo .tfw y no usan la información georreferenciada insertada en el archivo .tif. Aún otros, ofrecen la opción de usar una u otra fuente de datos georreferenciados (a veces con diferentes resultados). La información de georreferencia también se provee explícitamente en línea como parte de los metadatos de cada set de datos. Los conjuntos de datos SIG en la Base de Datos para la Arqueología Comparativa son internamente consistentes; si se combinan con datos espaciales de otras fuentes, es importante verificar su superposición apropiada para confirmar que las ubicaciones de rasgos espaciales en los datos de ambas fuentes son en realidad compatibles (como se discutió más arriba).
Importación de DXFs a ArcGIS
ArcGIS asume que cualquier capa de un mapa está georreferenciada a una ubicación particular sobre la superficie terrestre. Aunque este pueda ser un enfoque poderoso y universal para la combinación de datos espaciales de diferentes fuentes, muchas clases de análisis espaciales no requieren georreferenciación. Tales análisis pueden llevarse a cabo con los datos de la Base de Datos para la Arqueología Comparativa, sin importar la disponibilidad o precisión de la información de georreferenciación. Los temas de tales análisis incluyen agrupaciones o dispersiones espaciales, centralización, jerarquía de asentamientos, relaciones de redes, similitud de distribuciones espaciales múltiples, y muchos otros. La mayoría de los conjuntos de datos regionales en la Base de Datos para la Arqueología Comparativa incluye también información de elementos ambientales como topografía, hidrología, suelos, y otros recursos. Estas diferentes capas de los mapas dentro de un conjunto de datos están correctamente referenciadas unas a otras, aún para los conjuntos de datos recolectados antes de que la georreferenciación exacta fuera posible, o incluso común, para algunas regiones. Estos conjuntos de información geográfica son consistentes internamente y analizables en sus propios términos, sin necesidad de georreferenciación. Algunos programas de SIG (incluyendo AutoCAD Map, GRASS, Idrisi y otros) facilitan llevar a cabo análisis en cualquier sistema de coordenadas internamente consistente que sea conveniente, sin importar la georreferenciación. Las consultas de usuarios de ArcGIS, sin embargo, revelan que muchos encuentran obstáculos por la insistencia de ArcGIS en que todas las capas de mapas estén georreferenciadas. Este problema puede resolverse en ArcGIS, como se discute más abajo. La georreferenciación puede también lograrse aun cuando los metadatos georreferenciados no estén disponibles, como también se discute mas abajo. Estas notas no intentan sustituir la documentación que existe para ArcGIS sino simplemente llamar la atención hacia las herramientas relevantes de ArcGIS que algunos usuarios podrían no conocer.
Un archivo .dxf, por ejemplo, puede ser importado a ArcGIS arrastrándolo desde el panel de Catálogo (Catalog), o usando el atajo de Añadir Datos (Add Data). Ignore la advertencia de ArcGIS de que falta la información espacial y proceda. Las entidades de AutoCAD aparecen ahora bajo el archivo Capa de Grupo (Group Layer) en la Tabla de Contenidos (Table of Contents) de ArcGIS. Las entidades de Texto (Text) de AutoCAD aparecen como rasgos de Anotación (Annotation features) de ArcGIS; las entidades de Punto (Point entities) de AutoCAD aparecen como rasgos de Punto (Point features) de ArcGIS; las entidades de Polilínea (Polyline entities) de AutoCAD aparecen como rasgos de Polilínea (Polyline features) de ArcGIS; y las entidades de Polilíneas Cerradas (Closed Polyline entities) de AutoCAD aparecen como rasgos de Polígono (Polygon features) de ArcGIS. Las Tablas de Atributos (Attribute Tables) para los rasgos de ArcGIS contienen variables correspondientes a las varias propiedades de las entidades de AutoCAD, incluyendo, por ejemplo, Capa, Color, y otras.
Si los metadatos de georreferencia están disponibles, esa información puede ser usada para establecer las propiedades del Marco de Datos (Data Frame) de ArcGIS. Esto posiblemente requerirá especificar el sistema de coordenadas, el datum de base, y las unidades del mapa. ArcGIS, por ejemplo, es uno de los varios programas de GIS que son bastante insistentes en cuanto al uso de metros como las unidades en los mapas para el sistema de proyección UTM, mientras que otros softwares (incluyendo AutoCAD Map, GRASS, e Idrisi) permiten mayor flexibilidad y los conjuntos de datos basados en UTM pueden frecuentemente usar kilómetros como la unidad básica del mapa.
ArcGIS provee excelentes herramientas para georreferenciar mapas que no tienen metadatos de georreferenciación, o que parecen no ser muy precisos. Estas herramientas se encuentran en la barra de herramientas de Georreferenciación (Georeferencing) y Ajuste Espacial (Spatial Adjustment). Las herramientas más poderosas y flexibles permiten establecer Puntos de Control sobre el mapa no georreferenciado y decirle a ArcGIS cuáles son las coordenadas del mundo real de esos puntos de control en un sistema de coordenadas conocido. Las ubicaciones específicas de sitios, ríos, carreteras, pueblos modernos, etc., se incluyen frecuentemente en datos de SIG. Las coordenadas de estos lugares pueden establecerse, en el sistema UTM o Lat/Long, basado en el datum WGS84, encontrándolas en una fuente como Google Earth. En la medida en que las coordenadas de un cierto número de puntos de control puedan establecerse con exactitud de esta manera, la georreferenciación puede tener suficiente precisión para permitir la superposición de datos georreferenciados de otras fuentes. En cualquier caso de datos superpuestos de diferentes fuentes, el analista sensato insistirá en la verificación visual de la precisión del emparejamiento espacial. (¿Qué tan bien la ubicación de ríos, carreteras u otros rasgos identificables en ambas capas del mapa se emparejan, una vez que se han georreferenciado y superpuesto?)
Si el análisis planeado no implica superposición de datos espaciales de otras fuentes, sino que sólo requiere tener coherencia interna dentro de un sólo conjunto de capas, entonces podría ser conveniente localizar los datos espaciales en ArcGIS en una ubicacion aproximada en el mundo, usando rápidamente el método descrito arriba. No se necesita una gran inversión de tiempo para lograr una alta precisión. Siempre y cuando todos los elementos importados de un conjunto de datos internamente coherente sean tratados de la misma manera, la coherencia interna se mantendrá.
Una vez que los datos espaciales se importen a ArcGIS, un Shapefile puede ser creado con la opción de Exportar Datos (Export Data). Si la Tabla de Atributos (Attribute Table) que contiene las propiedades de AutoCAD de las entidades no está incluida con ellas, puede volver a incluirse con la herramienta Rasgo a Punto (Feature to Point) en la seccion de Manejo de Datos (Data Management) de la Caja de Herramientas (ArcToolbox), por ejemplo.
En un archivo .dxf, los identificadores de polígonos frecuentemente toman la forma de entidades de Texto de AutoCAD cuyos Puntos de Inserción (Insertion Points) están ubicados dentro de las Polilíneas Cerradas (Closed Polylines) que delinean a los polígonos. Cuando uno de tales mapas se importa a ArcGIS, la conexión entre los polígonos y sus identificadores debe ser restablecida. Esto puede hacerse con una Unión Espacial (Spatial Join). La capa que contiene los polígonos es la capa de Rasgos Meta (Target Features), y la capa de Rasgos de Anotación (Annotation Features) en que se ha convertido las entidades de Texto de AutoCAD es la capa de Rasgos de Unión (Join Features). La Operación de Union (Join Operation) es JOIN_ONE_TO_ONE (UNIR_UNO_A_UNO). Se creará una nueva capa con los polígonos, y su Tabla de Atributos (Attribute Table) incluirá los identificadores de cadenas de texto.
Estos identificadores pueden entonces ser la base para conectar otras tablas de datos (en la forma, por ejemplo, de una hoja de cálculo) a los polígonos. Por opción predeterminada, los identificadores en una capa de Anotación (Annotation) hecha de esta manera serán campos de texto (text fields). Si la tabla de datos externa tiene identificadores basdos en un campo numérico, el uno o el otro deberán ser cambiados, ya que ArcGIS no reconocerá la correspondencia entre un campo numérico y un campo de texto. Para cambiar el tipo de campo en ArcGIS, cree en la tabla una nueva columna con el tipo de campo deseado, y use la Calculadora de Campo (Field Calculator) para calcular sus valores con base en el campo de identificador existente. La tabla externa puede entonces ligarse a los polígonos con la Unión de Atributos (Join Attributes) de una herramienta de Tabla (Table) que se encuentra en el diálogo de Unión de Datos (Join Data). El campo que contiene los identificadores debe ser seleccionado tanto para la Tabla de Anotaciones (Annotation Table) como para la tabla externa de datos. Las columnas de la tabla externa se aumentarán a la Tabla de Anotaciones (Annotation Table). La estructura entera puede entonces ser guardada como un Shapefile con la herramienta de Exportar Datos (Export Data).
Guia para Autores: ArcGIS a DXF
Despues de submitir sus archivos, nosotros podemos hacer la converción de sus datos espaciales de vectores a formato .dxf. Sin embargo, para aquellos autores que deseen hacer la converción ellos mismos, proveemos ésta guia, adaptada de este artículo de ESRI para ArcGIS Pro. Provee instrucciones de paso-a-paso de como crear un .dxf georeferenciado que tiene los atributos de identificación como una linea de texto cuyo punto de insertamiento está dentro de los polígonos que representa: descargar la guia (en Inglés).