比较考古数据库提供的数据集采用经过精心选择的格式,以确保其长期可用性、便于存档,并具有广泛的兼容性。我们优先使用简单、广泛支持且易于导入各种研究工具的格式。然而,我们也认识到研究人员使用不同的软件,因此在许多情况下,我们提供标准化格式以及研究人员最初使用的原始格式。
每个数据集都包含元数据(数据字典),详细说明文件结构、坐标系统和变量定义。这些文档确保用户无论使用何种软件,都能正确整合和解释数据。

表格数据(案例与变量
大多数数据集包含表格,其中的行代表案例(例如遗址、文物或样本),列则包含描述它们的变量。
- 我们使用逗号分隔值(.csv)文件,因为它们简单、非专有,并且几乎与所有统计和电子表格软件兼容。一些数据集也使用 .txt 作为 CSV 文件的替代扩展名。
- 为了满足研究人员的原始格式需求,一些数据集还包含电子表格文件(.xlsx)或 ArcGIS 表格,以适应特定的研究工作流程。
空间数据
对于包含空间信息的数据集,我们提供矢量和栅格格式,以最大程度提高其可用性。

矢量绘图
对于矢量绘图,我们提供 AutoCAD DXF(绘图交换格式)文件,扩展名为 .dxf。这种格式在 GIS 和 CAD 软件中得到广泛支持,易于导入,并适合长期存档。大多数 GIS 软件都可以处理 DXF 文件,即使它们处理地理配准的方式不同。因此,每个绘图的元数据(数据字典)中都会单独提供坐标系统的详细信息。
在某些情况下,数据集还包括原始格式的专有文件(如 ArcGIS 形状文件),如果它们是研究人员原始数据集的一部分。

栅格图像
栅格图像(例如数字高程模型(DEM)地图或环境数据)以 GeoTIFF (.tif) 格式提供,该格式将地理配准数据嵌入数据文件中。
在某些情况下,数据集还提供原始的专有格式文件,如果它们是研究人员最初数据集的一部分。