[HADOOP] 어떻게 작업이 완료되기 전에 하둡에 감소 / 전체지도를 다시 실행하려면?
HADOOP어떻게 작업이 완료되기 전에 하둡에 감소 / 전체지도를 다시 실행하려면?
하둡지도를 사용하여 나는 / 자바를 사용 감소
나는 일을 줄일 수 / 전체지도를 완료 한 가정하자. 내가 / 전체 맵을 반복 작업을 종료하지 않고, 일부만을 줄일 수있는 방법이 있습니까. 내 말은, 나는 다른 작업의 체인을 사용하지 않으 만 만 반복 할 부분을 줄일 /지도를합니다.
감사합니다!
해결법
-
==============================
1.그래서 네이티브 API로 변환해야 하둡 스트리밍 API를하지만 접근 방식에 익숙해입니다.
그래서 네이티브 API로 변환해야 하둡 스트리밍 API를하지만 접근 방식에 익숙해입니다.
나의 이해에서 당신이 뭘 하려는지는 동일한 맵 ()와 감소 () 입력 데이터에 대한 작업의 여러 반복 실행됩니다.
초기지도 () 입력 데이터가 파일로부터 input.txt를 제공하고 출력 파일 출력 + (루프 반복 횟수, 반복 = [0, # 반복이다) {} 반복 .txt)로 말할 수있다. 지도의 두 번째 호출에서 () / 감소 () 사용자의 입력 파일을 출력 + {반복}이며, 출력 파일은 출력 + {반복 +1}가 .txt 될 것입니다.
이 명확하지 않은 경우 알려줘, 나는 간단한 예를 연상 여기에 링크를 게시 할 수 있습니다.
편집하다*
from https://stackoverflow.com/questions/5702018/how-to-re-run-whole-map-reduce-in-hadoop-before-job-completion by cc-by-sa and MIT license
'HADOOP' 카테고리의 다른 글
[HADOOP] hiveQL에서 선택 중첩 (0) | 2019.10.06 |
---|---|
[HADOOP] MySQL의와 하이브 JDBC 연결 설정 또는 매핑 (0) | 2019.10.06 |
[HADOOP] 어떻게 측면 뷰는 XML 데이터 형식 하이브에서 폭발 사용 하는가? (0) | 2019.10.06 |
[HADOOP] 하이브 - 버킷 팅 및 파티셔닝 (0) | 2019.10.06 |
[HADOOP] 돼지에서 CASE 문 (0) | 2019.10.06 |