UNIVERSITY OF PITTSBURGH
COMPARATIVE
ARCHAEOLOGY
DATABASE

Archivos de Datos: Notas Técnicas

La Base de Datos para la Arqueología Comparativa intenta presentar conjuntos de datos de diferentes proyectos, en un formato relativamente consistente, al mismo tiempo que reconoce que la arqueología involucra una variedad extremadamente amplia de tipos de datos, y que los arqueólogos han empleado, tradicionalmente, muchas formas diferentes de organizar sus datos. Esto a menudo puede parecer una molestia, pero es algo que simplemente no puede evitarse. En primer lugar, la naturaleza del registro arqueológico varía de una parte del mundo a otra a tal grado, que un arqueólogo con experiencia en una sola región del mundo no puede apreciarlo. Tal variación requiere de diferentes métodos de campo y diversas formas de organizar los datos. Aun bajo condiciones idénticas, arqueólogos con diferentes objetivos de investigación van a recolectar y, por consiguiente, presentar, los datos en maneras diferentes. Lo que constituye una organización eficiente de los datos puede estar determinado por estructuras diferentes requeridas por diferentes softwares analíticos (lo cual, por supuesto, puede cambiar rápidamente). Por si todo esto no fuera suficiente, los arqueólogos tenemos preferencias personales idiosincráticas, a las que nos aferramos tercamente, resistiéndonos a los dictámenes de otros en cuanto a cuáles son las "prácticas más adecuadas." Parafraseando a Marshall Sahlins cuando escribe acerca de la autoridad de los jefes, apenas un comité de estándares emita una palabra, los arqueólogos organizarán sus datos de la manera en que mejor les plazca. Ante esta situación, la Base de Datos para la Arqueología Comparativa no intenta imponer tal estandarización sobre los archivos de los diferentes conjuntos de datos. Un cierto número de estos conjuntos incluye elementos enteramente únicos, los cuales hemos tratado de presentar de maneras inventivas que aprovechen la presentación digital en línea, con organización intuitiva que no requiera de una explicación por separado. Hay también por lo menos unos pocos tipos recurrentes de elementos que intentamos tratar consistentemente. Hemos escogido unos pocos formatos estándares de archivos porque pueden importarse a una variedad especialmente amplia de softwares de análisis, y porque parece probable que persistan como formatos estándares ampliamente usados en el futuro. Adicionalmente hemos tratado de presentar los metadatos de una manera consistente (y, tememos, tal vez demasiado detallada).

Datos de Casos y Variables

Los datos cuantitativos frecuentemente toman la forma de casos codificados para una serie de variables. Tales archivos de datos se presentan como tablas en cuyas filas están los casos y en las columnas están las variables, según suelen organizarse en los programas de análisis estadístico. El archivo de texto ASCII delimitado por comas es un formato tipo mínimo común denomidador para tales archivos. La extensión de archivo usual es .txt. Estos archivos pueden leerse casi con cualquier programa que haya sido escrito para lidiar con tales datos, y este formato se usa de manera consistente en los conjuntos de datos de la Base de Datos para la Arqueología Comparativa. La primera y última líneas de estos archivos .txt se muestran y explican para ayudar a los usuarios a evitar errores en su interpretación y errores del software al importarlos. Los elementos centrales de los metadatos para tales archivos incluyen una indicación explícita de cuáles son los casos (filas) y una lista de las variables (columnas) con cualquier explicación necesaria para entender el contenido de la tabla. Los nombres de las variables no se incluyen en las primeras líneas de los archivos ASCII, como a veces se hace, ya que las convenciones para los nombres de variables varían mucho a través de los diferentes programas de análisis de datos. Los usuarios necesitarán referirse a los metadatos y crear sus propios nombres de variables en concordancia con los requerimientos del software que usen. En muchos conjuntos de datos, tales datos también pueden descargarse en formato para hoja de cálculo (.xls), que es más fácil de explorar (inclusive con software de código abierto como OpenOffice).

Datos Espaciales y Georreferenciación

Los datos espaciales presentan un cierto número de complejidades particulares. Una de ellas es la georreferenciación. Muchas de las recolecciones de datos arqueológicos se llevaron a cabo, obviamente, antes de que la georreferenciación global se estandarizara y antes de que el uso de equipos de GPS se generalizara. A escalas pequeñas (tales como ubicaciones sobre una superficie de vivienda o dentro de un sitio), lo que importa es la posición espacial relativa, y el uso de sistemas de coordenadas no georreferenciadas ha sido común, y continua siéndolo. En efecto, lo mismo es cierto, frecuentemente, para escalas más grandes (regionales), aunque los equipos de campo con base en GPS puedan recolectar datos en sistemas de coordenadas georreferenciadas, y algunos programas de GIS asuman automáticamente que los sistemas de coordenadas están georreferenciados, requiriéndose un esfuerzo adicional para trabajar con un sistema arbitrario de coordenadas, si la georreferenciación no es útil.

La naturaleza de la información georreferenciada disponible varía de un conjunto de datos a otro, dependiendo de cuándo, dónde, y cómo se recolectó la información espacial. A medida que los datos ambientales georreferenciados ampliamente disponibles aumenta en cantidad y mejora en resolución, también aumenta la tentación de superponer distribuciones de asentamientos arqueológicos a escala regional sobre información ambiental de varias clases disponible más recientemente. Para los conjuntos de datos de escala regional en la Base de Datos para la Arqueología Comparativa, se ha hecho un esfuerzo para ser explícitos en cuanto a los sistemas de coordenadas usados para los datos espaciales, y para proveer información que pueda ser útil para la georreferenciación. Como es siempre el caso cuando se intenta superponer datos espaciales de diferentes fuentes, el usuario deberá usar extrema precaución al revisar que los datos de diferentes fuentes estén registrados apropiadamente antes de proceder con cualquier forma de análisis. Una manera de hacerlo, por supuesto, es determinar si los rasgos visibles fácilmente en los datos de las diferentes fuentes (arroyos, carreteras, rasgos topográficos rápidamente distinguibles, etc.) concuerdan en la superposición. Todos los programas poderosos de GIS proveen herramientas para registrar apropiadamente datos de diferentes fuentes por medio de emparejar dichos rasgos compartidos, sea que los metadatos acerca de los sistemas de coordenadas estén disponibles o no. Estas herramientas probablemente producirán mejores resultados (en la forma de conjuntos de datos más exactos y confiablemente registrados) que el registro "automático" de múltiples conjuntos de datos basados en georreferenciación incorrecta o imprecisa de metadatos.

Datos Espaciales en Formato Vectorial y Archivos .dxf de AutoCAD Map

La información espacial en formato vectorial en la Base de Datos para la Arqueología Comparativa se provee usualmente como archivos .dxf de AutoCAD Edición 12. Este formato puede ser importado a una amplia variedad de programas para gráficos y GIS. Es un formato nativo para AutoCAD Map; por lo tanto, no es necesaria la "importación" y la estructura de los datos va a ser familiar para los usuarios de AutoCAD Map. Las estructuras y vocabulario de los datos, sin embargo, difieren pronunciadamente entre los programas para GIS. Los diversos programas varían sustancialmente en su habilidad para detectar y utilizar correctamente la información georreferenciada integrada en los archivos .dxf para AutoCAD Map. Por esta razón, la mayoría de los archivos .dxf en la Base de Datos para la Arqueología Comparativa no contienen información georreferenciada integrada, la cual se provee como parte de los metadatos. Aquel usuario que necesite datos arqueológicos georreferenciados debe entonces prestar especial atención al contenido de la información georreferenciada disponible y saber cómo usarla correctamente en el software al cual se importa un archivo .dxf. En vista de que, al momento, muchos arqueólogos usan ArcGIS, se proveen algunas sugerencias para importar datos a ArcGIS. Para ciertos conjuntos de datos, se provee también información espacial en forma vectorial en los formatos originales usados por los autores de los datos, asi como en archivos .dxf.

Datos Espaciales en Formato Ráster y Archivos GeoTiff

La información espacial en formato ráster en la Base de Datos para la Arqueología Comparativa se provee usualmente como archivos GeoTiff. La información georreferenciada siempre está integrada en estos archivos .tif, asi como en sus archivos .tfw acompañantes pero separados. Algunos programas de GIS georreferencian archivos GeoTIFF al momento de importar, de acuerdo con la información insertada, y no usa el archivo .tfw. Otros programas se apoyan en el archivo .tfw y no usan la información georreferenciada insertada en el archivo .tif. Aún otros programas, ofrecen la opción de usar una u otra fuente de datos georreferenciados (a veces con diferentes resultados). La información de georreferencia también se provee explícitamente en línea como parte de los metadatos para el conjunto de datos. Los conjuntos de datos GIS en la Base de Datos para la Arqueología Comparativa son internamente consistentes; si se combinan con datos espaciales de otras fuentes, es importante verificar el registro apropiado para confirmar que las ubicaciones de rasgos espaciales en los datos de ambas fuentes son en realidad compatibles (como se discutió más arriba).