DynamoDB InputFormat for Hadoop

Hadoop 맵 축소를 사용하여 Amazon Dynamo DB에서 유지되는 일부 데이터를 처리해야합니다.

Dynamo DB 용 Hadoop InputFormat을 인터넷을 통해 검색하고 찾을 수 없습니다. DynamoDB에 익숙하지 않아 DynamoDB 및 Hadoop과 관련된 트릭이 있다고 생각합니까? 이 입력 형식을 구현할 수있는 곳이 있다면 공유해주십시오.

해결법

==============================
1.많은 검색을 한 후에 Amazon의 라이브러리 중 하나에서 DynamoDBInputFormat 및 DynamoDBOutputFormat을 발견했습니다.

많은 검색을 한 후에 Amazon의 라이브러리 중 하나에서 DynamoDBInputFormat 및 DynamoDBOutputFormat을 발견했습니다.

amazon elastic map reduce에는 dynamoDB에 대한 입력 및 출력 형식을 포함하는 hive-bigbird-handler라는 라이브러리가 있습니다. 전체 클래스 이름은 org.apache.hadoop.hive.dynamodb.write.DynamoDBOutputFormat 및 org.apache.hadoop.hive.dynamodb.read.DynamoDBInputFormat입니다.

이 수업이 지역 사회에 도움이되기를 바랍니다.
==============================
2.MapReduce에서 직접 사용할 수있는 InputFormat을 찾을 수 없습니다. 그러나 여기 AWS HowTo 기사 : DynamoDB (Guest Post)와 함께 Amazon Elastic MapReduce를 사용하여 Hive를 사용하여 MarReduce 작업을 실행합니다.

MapReduce에서 직접 사용할 수있는 InputFormat을 찾을 수 없습니다. 그러나 여기 AWS HowTo 기사 : DynamoDB (Guest Post)와 함께 Amazon Elastic MapReduce를 사용하여 Hive를 사용하여 MarReduce 작업을 실행합니다.

[HADOOP] MapReduce 프레임 워크는 정렬 단계를 어떻게 구현합니까? (0)	2019.07.30
[HADOOP] 아파치 돼지에서 리눅스 'diff'와 동등 (0)	2019.07.29
[HADOOP] hadoop 데이터 노드를 정상적으로 시작할 수 없습니다. (0)	2019.07.29
[HADOOP] 태스크 제한 시간 때문에 Sqoop 가져 오기 작업이 실패합니다. (0)	2019.07.29
[HADOOP] Python을 사용하여 HDFS에서 파일 이름 목록보기 (0)	2019.07.29