쿼리를 사용하여 Amazon Neptune에 데이터 로드 - Amazon Neptune

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

쿼리를 사용하여 Amazon Neptune에 데이터 로드

Neptune은 쿼리 언어 작업을 통해 직접 데이터 쓰기를 지원합니다. openCypherMERGECREATE 및 , SPARQL의 또는 mergeE() GremlinINSERTmergeV() 및와 같은 표준 쓰기 작업을 사용하여 그래프에 데이터를 추가하거나 수정할 수 있습니다. 이러한 작업은 증분 업데이트 및 트랜잭션 쓰기에 적합합니다.

Amazon S3에서 데이터를 로드하려면 최적화된 성능이 필요한 대규모 데이터 세트에 Amazon Neptune 대량 로더를 사용하여 데이터 수집를 사용합니다. 하나 또는 몇 개의 Amazon S3 파일에 있는 작은 데이터 세트의 경우 쿼리 기반 로드 함수를 사용하여 쿼리 내에서 직접 데이터를 읽고 처리할 수 있습니다.

다음과 같은 쿼리 기반 로드 함수를 사용할 수 있습니다.

openCypher: neptune.read()

neptune.read() 함수는 CALL 하위 쿼리 내에서 Amazon S3에서 CSV 또는 Parquet 파일을 읽으므로 쿼리 시 데이터를 처리하고 로드할 수 있습니다.

CALL neptune.read({ source: "s3://bucket/data.csv", format: "csv" }) YIELD row CREATE (n:Person {id: row.id, name: row.name})

전체 설명서는 섹션을 참조하세요neptune.read().

SPARQL: LOAD 및 UNLOAD

SPARQL LOAD 작업은 URI의 RDF 데이터를 명명된 그래프로 가져옵니다.는 그래프의 데이터를 Amazon S3로 UNLOAD 내보냅니다.

LOAD <s3://bucket/data.ttl> INTO GRAPH <http://example.org/graph>

전체 설명서는 섹션을 참조하세요SPARQL UPDATE LOAD를 사용하여 데이터를 Neptune으로 가져오기.

Gremlin: io() 단계

Gremlin의 g.io(URL).read() 단계를 사용하여 GraphML(XML 형식), GraphSON(JSON 형식) 및 기타 형식의 데이터 파일을 읽을 수도 있습니다.

g.io("s3://bucket/data.graphml").read().iterate()

자세한 내용은 TinkerPop 설명서를 참조하세요.