As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
netuno.read ()
O Neptune suporta CALL um neptune.read procedimento para ler dados do Amazon S3 e, em seguida, executar uma consulta OpenCypher (ler, inserir, atualizar) usando os dados. O procedimento produz cada linha no arquivo como uma linha de variável de resultado declarada. Ele usa as credenciais do IAM do chamador para acessar os dados no Amazon S3. Consulte Gerenciando permissões para neptune.read () para configurar as permissões. A AWS região do bucket do Amazon S3 deve estar na mesma região em que a instância está localizada. Atualmente, não há suporte para leituras entre regiões.
Sintaxe
CALL neptune.read( { source: "string", format: "parquet/csv", concurrency: 10 } ) YIELD row ...
Entradas
-
source (obrigatório) - URI do Amazon S3 para um único objeto. O prefixo Amazon S3 para vários objetos não é suportado.
-
formato (obrigatório) -
parquetecsvsão suportados.-
Mais detalhes sobre o formato Parquet compatível podem ser encontrados emTipos de coluna de parquet suportados.
-
Para obter mais informações sobre o formato csv compatível, consulteFormato de carregamento para dados do openCypher.
-
-
concorrência (opcional) - Tipo: número inteiro 0 ou maior. Padrão: 0. Especifica o número de segmentos a serem usados para ler o arquivo. Se o valor for 0, o número máximo de threads permitido pelo recurso será usado. Para Parquet, é recomendável definir vários grupos de linhas.
Saídas
O neptune.read retorna:
-
linha - Tipo: mapa
-
Cada linha no arquivo, onde as chaves são as colunas e os valores são os dados encontrados em cada coluna.
-
Você pode acessar os dados de cada coluna como uma propriedade access (
row.col).
-
Melhores práticas para neptune.read ()
As operações de leitura do Neptune S3 podem consumir muita memória. Use tipos de instância adequados para cargas de trabalho de produção, conforme descrito em Escolha de tipos de instância para o Amazon Neptune.
O uso da memória e o desempenho das neptune.read() solicitações são afetados por vários fatores, como tamanho do arquivo, número de colunas, número de linhas e formato do arquivo. Dependendo da estrutura, arquivos pequenos (por exemplo, arquivos CSV de 100 MB ou menos, arquivos Parquet de 20 MB ou menos) podem funcionar de forma confiável na maioria dos tipos de instância adequados à produção, enquanto arquivos maiores podem exigir memória substancial que tipos de instância menores não podem fornecer.
Ao testar esse recurso, é recomendável começar com arquivos pequenos e escalar gradualmente para garantir que sua carga de trabalho de leitura possa ser acomodada pelo tamanho da instância. Se você observar neptune.read() solicitações que levam a out-of-memory exceções ou reinicializações de instâncias, considere dividir seus arquivos em partes menores, reduzir a complexidade dos arquivos ou fazer o upgrade para tipos de instância maiores.