복붙노트

[HADOOP] 어떻게 작업이 완료되기 전에 하둡에 감소 / 전체지도를 다시 실행하려면?

HADOOP

어떻게 작업이 완료되기 전에 하둡에 감소 / 전체지도를 다시 실행하려면?

하둡지도를 사용하여 나는 / 자바를 사용 감소

나는 일을 줄일 수 / 전체지도를 완료 한 가정하자. 내가 / 전체 맵을 반복 작업을 종료하지 않고, 일부만을 줄일 수있는 방법이 있습니까. 내 말은, 나는 다른 작업의 체인을 사용하지 않으 만 만 반복 할 부분을 줄일 /지도를합니다.

감사합니다!

해결법

  1. ==============================

    1.그래서 네이티브 API로 변환해야 하둡 스트리밍 API를하지만 접근 방식에 익숙해입니다.

    그래서 네이티브 API로 변환해야 하둡 스트리밍 API를하지만 접근 방식에 익숙해입니다.

    나의 이해에서 당신이 뭘 하려는지는 동일한 맵 ()와 감소 () 입력 데이터에 대한 작업의 여러 반복 실행됩니다.

    초기지도 () 입력 데이터가 파일로부터 input.txt를 제공하고 출력 파일 출력 + (루프 반복 횟수, 반복 = [0, # 반복이다) {} 반복 .txt)로 말할 수있다. 지도의 두 번째 호출에서 () / 감소 () 사용자의 입력 파일을 출력 + {반복}이며, 출력 파일은 출력 + {반복 +1}가 .txt 될 것입니다.

    이 명확하지 않은 경우 알려줘, 나는 간단한 예를 연상 여기에 링크를 게시 할 수 있습니다.

    편집하다*

  2. from https://stackoverflow.com/questions/5702018/how-to-re-run-whole-map-reduce-in-hadoop-before-job-completion by cc-by-sa and MIT license