[HADOOP] 지도 축소 : ChainMapper 및 ChainReducer
HADOOP지도 축소 : ChainMapper 및 ChainReducer
필자는 Map Reduce jar 파일을 두 작업에서 분리하여 두 개의 다른 출력 파일을 얻으려고합니다. 하나는 두 작업의 각 감속기에서 하나씩입니다.
첫 번째 작업은 체인의 두 번째 작업에 대한 입력이 될 출력 파일을 생성해야한다는 의미입니다.
hadoop 버전 0.20에서 ChainMapper 및 ChainReducer에 대한 내용을 읽었습니다. (현재 0.18을 사용하고 있습니다.) 내 요구에 잘 맞을 수 있습니까?
아무도 그 방법을 사용하기 위해 몇 가지 예제를 찾을 수있는 링크를 제안 할 수 있습니까? 아니면 내 문제를 해결할 다른 방법이 있을까요?
고맙습니다,
루카
해결법
-
==============================
1.당신이 그것을 할 수있는 많은 방법이 있습니다.
당신이 그것을 할 수있는 많은 방법이 있습니다.
-
==============================
2.위의 솔루션은 디스크 I / O 작업과 관련이 있으므로 대용량 데이터 세트의 속도가 느려질 것이라고 생각합니다. 대체적으로 Oozie 또는 Cascading을 사용하는 것입니다.
위의 솔루션은 디스크 I / O 작업과 관련이 있으므로 대용량 데이터 세트의 속도가 느려질 것이라고 생각합니다. 대체적으로 Oozie 또는 Cascading을 사용하는 것입니다.
from https://stackoverflow.com/questions/3059736/map-reduce-chainmapper-and-chainreducer by cc-by-sa and MIT license
'HADOOP' 카테고리의 다른 글
[HADOOP] WebHDFS 대 HttpFS (0) | 2019.07.07 |
---|---|
[HADOOP] hadoop fs -copyToLocal 명령을 사용하여 기존 파일을 덮어 쓰는 방법 (0) | 2019.07.07 |
[HADOOP] Eclipse로 Hadoop 맵핑 / 축소 작업 개발, 테스트 및 디버깅 (0) | 2019.07.07 |
[HADOOP] hadoop을 사용한 이미지 처리 (0) | 2019.07.07 |
[HADOOP] Hadoop Streaming에서 "typedbytes"또는 "rawbytes"를 사용하는 방법은 무엇입니까? (0) | 2019.07.07 |