neptune.read () - Amazon Neptune

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

neptune.read ()

Neptune admite un CALL procedimiento neptune.read para leer datos de Amazon S3 y, a continuación, ejecutar una consulta de OpenCypher (lectura, inserción, actualización) con los datos. El procedimiento convierte cada fila del archivo en una fila de variables de resultado declaradas. Utiliza las credenciales de IAM de la persona que llama para acceder a los datos de Amazon S3. Consulte Administrar los permisos de neptune.read () para configurar los permisos. La AWS región del bucket de Amazon S3 debe estar en la misma región en la que se encuentra la instancia. Actualmente, no se admiten las lecturas entre regiones.

Sintaxis

CALL neptune.read( { source: "string", format: "parquet/csv", concurrency: 10 } ) YIELD row ...
Entradas
  • source (obligatorio): URI de Amazon S3 para un solo objeto. No se admite el prefijo Amazon S3 para varios objetos.

  • formato (obligatorio): parquet y csv son compatibles.

  • simultaneidad (opcional): tipo: número entero 0 o superior. Valor predeterminado: 0. Especifica el número de subprocesos que se utilizarán para leer el archivo. Si el valor es 0, se utilizará el número máximo de subprocesos permitido por el recurso. En el caso de Parquet, se recomienda configurarlo en varios grupos de filas.

Outputs

El archivo neptune.read devuelve:

  • fila: tipo: mapa

    • Cada fila del archivo, donde las claves son las columnas y los valores son los datos que se encuentran en cada columna.

    • Puede acceder a los datos de cada columna como si fuera una propiedad access (row.col).

Mejores prácticas para neptune.read ()

Las operaciones de lectura de Neptune S3 pueden consumir mucha memoria. Utilice tipos de instancias adecuados para las cargas de trabajo de producción, tal y como se describe en Elegir tipos de instancias para Amazon Neptune.

El uso de la memoria y el rendimiento de neptune.read() las solicitudes se ven afectados por diversos factores, como el tamaño del archivo, el número de columnas, el número de filas y el formato del archivo. Según la estructura, los archivos pequeños (por ejemplo, los archivos CSV de 100 MB o menos y los archivos Parquet de 20 MB o menos) pueden funcionar de forma fiable en la mayoría de los tipos de instancias adecuados para la producción, mientras que los archivos más grandes pueden requerir una cantidad considerable de memoria que los tipos de instancias más pequeños no pueden proporcionar.

Al probar esta función, se recomienda empezar con archivos pequeños y ampliarlos gradualmente para garantizar que la carga de trabajo de lectura se adapte al tamaño de la instancia. Si observas que neptune.read() las solicitudes provocan out-of-memory excepciones o se reinician las instancias, considera la posibilidad de dividir los archivos en fragmentos más pequeños, reducir la complejidad de los archivos o actualizarlos a tipos de instancias más grandes.