[HADOOP] 지도 전용 작업에 셔플 및 정렬이 있습니까?
HADOOP지도 전용 작업에 셔플 및 정렬이 있습니까?
shuffle 및 정렬 단계가 맵 작업이 끝나기 전에 이루어 지거나 출력이 맵 작업에서 생성 된 후 맵 작업으로 돌아 가지 않게됩니다. 이것은 혼란을 가져 오는 '지도 전용 작업'사례입니다. Map Only 작업에 셔플 및 정렬이없는 경우 누군가가 최종 출력 파일에 데이터를 기록하는 방법을 설명 할 수 있습니까?
해결법
-
==============================
1.지도 전용 작업을 수행하면 매퍼 링이 전혀 수행되지 않으므로 매퍼가 최종 출력물을 HDFS에 직접 작성합니다.
지도 전용 작업을 수행하면 매퍼 링이 전혀 수행되지 않으므로 매퍼가 최종 출력물을 HDFS에 직접 작성합니다.
다른 한편, 맵퍼 및 리듀서가있는 Map-Reduce 전체 프로그램을 사용하는 경우 단계 이동을 시작하기 전에 셔플을 시작할 수 있습니다.
그래서이 아주 좋은 대답을 인용 :
희망이 답변은 혼란을 명확히했다.
from https://stackoverflow.com/questions/42621466/will-there-be-shuffle-and-sort-in-map-only-task by cc-by-sa and MIT license
'HADOOP' 카테고리의 다른 글
[HADOOP] 하이브에서 줄 바꿈 문자 처리 (0) | 2019.06.11 |
---|---|
[HADOOP] "hadoop version"명령을 실행하는 동안 Cygwin에서 Hadoop의 CLASSPATH 문제 (0) | 2019.06.10 |
[HADOOP] Hadoop 가상 분산 모드 - 데이터 노드 및 작업 추적기가 시작되지 않음 (0) | 2019.06.10 |
[HADOOP] EMR에 열린 파일이 너무 많습니다. (0) | 2019.06.10 |
[HADOOP] 돼지에서 csv 읽기, csv 파일에는 인용 된 쉼표가 들어 있습니다. (0) | 2019.06.10 |