netuno.read ()

O Neptune suporta CALL um neptune.read procedimento para ler dados do Amazon S3 e, em seguida, executar uma consulta OpenCypher (ler, inserir, atualizar) usando os dados. O procedimento produz cada linha no arquivo como uma linha de variável de resultado declarada. Ele usa as credenciais do IAM do chamador para acessar os dados no Amazon S3. Consulte Gerenciando permissões para neptune.read () para configurar as permissões. A AWS região do bucket do Amazon S3 deve estar na mesma região em que a instância está localizada. Atualmente, não há suporte para leituras entre regiões.

Sintaxe


CALL neptune.read(
  {
    source: "string",
    format: "parquet/csv",
    concurrency: 10
  }
)
YIELD row
...

Entradas

source (obrigatório) - URI do Amazon S3 para um único objeto. O prefixo Amazon S3 para vários objetos não é suportado.
formato (obrigatório) - parquet e csv são suportados.
- Mais detalhes sobre o formato Parquet compatível podem ser encontrados emTipos de colunas de parquet compatíveis.
- Para obter mais informações sobre o formato csv compatível, consulteFormato de dados de carga do Gremlin.
concorrência (opcional) - Tipo: número inteiro 0 ou maior. Padrão: 0. Especifica o número de segmentos a serem usados para ler o arquivo. Se o valor for 0, o número máximo de threads permitido pelo recurso será usado. Para Parquet, é recomendável definir vários grupos de linhas.

Saídas

O neptune.read retorna:

linha - Tipo: mapa
- Cada linha no arquivo, onde as chaves são as colunas e os valores são os dados encontrados em cada coluna.
- Você pode acessar os dados de cada coluna como um acesso à propriedade (row.col).

Melhores práticas para neptune.read ()

As operações de leitura do Neptune S3 podem consumir muita memória. Use tipos de instância adequados para cargas de trabalho de produção, conforme descrito em Escolha de tipos de instância para o Amazon Neptune.

O uso da memória e o desempenho das neptune.read() solicitações são afetados por vários fatores, como tamanho do arquivo, número de colunas, número de linhas e formato do arquivo. Dependendo da estrutura, arquivos pequenos (por exemplo, arquivos CSV de 100 MB ou menos, arquivos Parquet de 20 MB ou menos) podem funcionar de forma confiável na maioria dos tipos de instância adequados à produção, enquanto arquivos maiores podem exigir memória substancial que tipos de instância menores não podem fornecer.

Ao testar esse recurso, é recomendável começar com arquivos pequenos e escalar gradualmente para garantir que sua carga de trabalho de leitura possa ser acomodada pelo tamanho da instância. Se você observar neptune.read() solicitações que levam a exceções de falta de memória ou reinicializações de instâncias, considere dividir seus arquivos em partes menores, reduzir a complexidade dos arquivos ou fazer o upgrade para tipos de instância maiores.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Extensões

Exemplos de consulta usando parquet