복붙노트

[HADOOP] MapReduce의 응집 [폐쇄]

HADOOP

MapReduce의 응집 [폐쇄]

우리는 어떻게 .CSV의 열 그쪽으로 최대 및 최소의 요소를 찾을 수 있습니다.

우리는 매퍼의 context.write (키, 값)로 무엇을 전달해야합니다.

해결책

해결법

  1. ==============================

    1.이는 SO 질문에 대한 폭 넓은 약간입니다하지만 난 물린 것이다.

    이는 SO 질문에 대한 폭 넓은 약간입니다하지만 난 물린 것이다.

    귀하의 매퍼 키에 매핑 값이다. 당신의 CSV 숫자 값과 4 열이 말할 수 :

    각 값에 대한 키를 매핑; 효과적으로 CSV의 헤더처럼 무엇을 할 것이다. 4 열에는 "위젯의 수를"대표라고 할 수 있습니다. 당신은 당신의 매퍼에 열 4의 값 키로 "number_of_widgets을"지도 것입니다.

    감속기는 주어진 키에 대한 모든 값을 얻을 것입니다. 당신이 당신의 최소 / 최대 알아낼 곳이다. 당신은 비록 키에 대한 모든 값을 반복하고 최소 및 최대 추적합니다.

  2. ==============================

    2.매퍼 파일 트랜스한다 - 각 광고 읽기, 열 번호와 키 및 열의 값으로서 방출한다.

    매퍼 파일 트랜스한다 - 각 광고 읽기, 열 번호와 키 및 열의 값으로서 방출한다.

    감속기 / 최대 min으로한다. 각 입력 키, 검색된 최소 및 최대 값을 방출한다.

  3. from https://stackoverflow.com/questions/21040166/aggregation-in-mapreduce by cc-by-sa and MIT license