[HADOOP] MR 작업의 다양한 단계의 올바른 순서?
HADOOPMR 작업의 다양한 단계의 올바른 순서?
나는 MR 작업을 통해가는 다양한 단계를 이해하려고 노력하고 있습니다. 저도 같은에 대한 온라인 문서를 참조하십시오.
이를 바탕으로, 순서에 이해의 나은 다음과 같습니다 :
지도 () -> 파티션 설정 -> (매퍼 기계에) 정렬 -> 셔플 -> (감속기 기계에) 정렬 -> (감속기 기계에서) (키) GROUPBY -> (감소)
이것은 MR 작업이 실행하는 올바른 순서인가?
해결법
-
==============================
1.지도의 다양한 단계는 작업을 줄일 수 :
지도의 다양한 단계는 작업을 줄일 수 :
지도 상 :
파티션 상
셔플 상
정렬 단계
상을 줄
-
==============================
2.지도의 타임 라인 작업 감소
지도의 타임 라인 작업 감소
MapTask에 대한 타임 라인
ReduceTask에 대한 타임 라인
이미지 출처 : https://www.slideshare.net/EmilioCoppa/hadoop-internals
from https://stackoverflow.com/questions/49187138/correct-order-of-various-phases-of-mr-job by cc-by-sa and MIT license
'HADOOP' 카테고리의 다른 글
[HADOOP] 문제 하둡에 RecommenderJob를 실행 (0) | 2019.09.20 |
---|---|
[HADOOP] 돼지 필요한 유형의 스키마 변경 (0) | 2019.09.20 |
[HADOOP] 어떻게 하이브의 교차로와 두 배열의 조합을 계산하기? (0) | 2019.09.20 |
[HADOOP] org.apache.hive.service.cli.HiveSQLException : java.lang.NoClassDefFoundError가 : 조직 / 아파치 / 하둡 / IPC / CallerContext $ 빌더 (0) | 2019.09.20 |
[HADOOP] 명령 줄에서 자바를 컴파일 오류 (0) | 2019.09.20 |