View a markdown version of this page

Formatos de los datos de carga - Amazon Neptune

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Formatos de los datos de carga

La API Load de Amazon Neptune admite la carga de datos en una gran variedad de formatos.

Property-graph formatos de carga

A continuación, se pueden consultar los datos cargados en uno de los siguientes formatos de gráficos de propiedades mediante Gremlin y openCypher:

Formatos de carga RDF

Para cargar datos del marco de descripción de recursos (RDF) que consulte mediante SPARQL, puede utilizar uno de los siguientes formatos estándar especificados por el World Wide Web Consortium (W3C):

Los datos de carga deben usar UTF-8 codificación

importante

Todos los archivos de datos de carga deben estar codificados en UTF-8 su forma. Si un archivo no está UTF-8 codificado, Neptune intenta cargarlo de todos modos. UTF-8

Para N-Quads los N-triples datos que incluyen caracteres Unicode, se admiten secuencias de \uxxxxx escape. Sin embargo, Neptune no admite la normalización. Si aparece un valor que requiere normalización, no se obtendrá una coincidencia byte a byte durante la consulta. Para obtener más información sobre la normalización, consulte la página de normalización en Unicode.org.

Si los datos no están en un formato compatible, debe convertirlos antes de cargarlos.

Una herramienta para convertir GraphML al formato CSV de Neptune está disponible en el proyecto GraphML2CSV en. GitHub

Compatibilidad con compresión para archivos de datos de carga

Neptune admite la compresión de archivos individuales en formato gzip o bzip2.

El archivo comprimido debe tener una .bz2 extensión .gz o y debe ser un archivo de texto único codificado en formato. UTF-8 Puede cargar varios archivos, pero cada uno debe ser un archivo .gz, .bz2 o un archivo de texto sin comprimir independiente. No es posible archivar archivos con extensiones como .tar, .tar.gz y .tgz.

En las siguientes secciones se describen los formatos de manera más detallada.