[HADOOP] MapReduce의 응집 [폐쇄]
HADOOPMapReduce의 응집 [폐쇄]
우리는 어떻게 .CSV의 열 그쪽으로 최대 및 최소의 요소를 찾을 수 있습니다.
우리는 매퍼의 context.write (키, 값)로 무엇을 전달해야합니다.
해결책
해결법
-
==============================
1.이는 SO 질문에 대한 폭 넓은 약간입니다하지만 난 물린 것이다.
이는 SO 질문에 대한 폭 넓은 약간입니다하지만 난 물린 것이다.
귀하의 매퍼 키에 매핑 값이다. 당신의 CSV 숫자 값과 4 열이 말할 수 :
각 값에 대한 키를 매핑; 효과적으로 CSV의 헤더처럼 무엇을 할 것이다. 4 열에는 "위젯의 수를"대표라고 할 수 있습니다. 당신은 당신의 매퍼에 열 4의 값 키로 "number_of_widgets을"지도 것입니다.
감속기는 주어진 키에 대한 모든 값을 얻을 것입니다. 당신이 당신의 최소 / 최대 알아낼 곳이다. 당신은 비록 키에 대한 모든 값을 반복하고 최소 및 최대 추적합니다.
-
==============================
2.매퍼 파일 트랜스한다 - 각 광고 읽기, 열 번호와 키 및 열의 값으로서 방출한다.
매퍼 파일 트랜스한다 - 각 광고 읽기, 열 번호와 키 및 열의 값으로서 방출한다.
감속기 / 최대 min으로한다. 각 입력 키, 검색된 최소 및 최대 값을 방출한다.
from https://stackoverflow.com/questions/21040166/aggregation-in-mapreduce by cc-by-sa and MIT license
'HADOOP' 카테고리의 다른 글
[HADOOP] 스파크 RDD에서 combineByKey 및 aggregateByKey없이 지정된 출력을 얻는 방법 (0) | 2019.10.23 |
---|---|
[HADOOP] 맵리 듀스를 사용하여 암호로 보호 된 zip 파일을 처리하면 [복제] (0) | 2019.10.23 |
[HADOOP] HDFS에 웹 사이트에서 직접 데이터를 얻기 (0) | 2019.10.22 |
[HADOOP] 어떻게 하이브에서 백분위를 구현하는 방법? (0) | 2019.10.22 |
[HADOOP] 설치 및 하둡에 elasticsearch 구성? (0) | 2019.10.22 |