neptune.read ()

Neptune admite un CALL procedimiento neptune.read para leer datos de Amazon S3 y, a continuación, ejecutar una consulta de OpenCypher (lectura, inserción, actualización) con los datos. El procedimiento convierte cada fila del archivo en una fila de variables de resultado declaradas. Utiliza las credenciales de IAM de la persona que llama para acceder a los datos de Amazon S3. Consulte Administrar los permisos de neptune.read () para configurar los permisos. La AWS región del bucket de Amazon S3 debe estar en la misma región en la que se encuentra la instancia. Actualmente, no se admiten las lecturas entre regiones.

Sintaxis


CALL neptune.read(
  {
    source: "string",
    format: "parquet/csv",
    concurrency: 10
  }
)
YIELD row
...

Entradas

source (obligatorio): URI de Amazon S3 para un solo objeto. No se admite el prefijo Amazon S3 para varios objetos.
formato (obligatorio): parquet y csv son compatibles.
- Encontrará más información sobre el formato Parquet compatible enTipos de columnas de parquet compatibles.
- Para obtener más información sobre el formato csv compatible, consulteFormato de datos de carga de Gremlin.
simultaneidad (opcional): tipo: número entero 0 o superior. Valor predeterminado: 0. Especifica el número de subprocesos que se utilizarán para leer el archivo. Si el valor es 0, se utilizará el número máximo de subprocesos permitido por el recurso. Para Parquet, se recomienda configurarlo en varios grupos de filas.

Outputs

El archivo neptune.read devuelve:

fila: tipo: mapa
- Cada fila del archivo, donde las claves son las columnas y los valores son los datos que se encuentran en cada columna.
- Puede acceder a los datos de cada columna como si fuera una propiedad access (row.col).

Mejores prácticas para neptune.read ()

Las operaciones de lectura de Neptune S3 pueden consumir mucha memoria. Utilice tipos de instancias adecuados para las cargas de trabajo de producción, tal y como se describe en Elegir tipos de instancias para Amazon Neptune.

El uso de la memoria y el rendimiento de neptune.read() las solicitudes se ven afectados por diversos factores, como el tamaño del archivo, el número de columnas, el número de filas y el formato del archivo. Según la estructura, los archivos pequeños (por ejemplo, los archivos CSV de 100 MB o menos y los archivos Parquet de 20 MB o menos) pueden funcionar de forma fiable en la mayoría de los tipos de instancias adecuados para la producción, mientras que los archivos más grandes pueden requerir una cantidad considerable de memoria que los tipos de instancias más pequeños no pueden proporcionar.

Al probar esta función, se recomienda empezar con archivos pequeños y ampliarlos gradualmente para garantizar que la carga de trabajo de lectura se adapte al tamaño de la instancia. Si observas que neptune.read() las solicitudes provocan excepciones por falta de memoria o se reinician las instancias, considera la posibilidad de dividir los archivos en fragmentos más pequeños, reducir la complejidad de los archivos o actualizarlos a tipos de instancias más grandes.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Extensiones

Consulta ejemplos mediante parquet