복붙노트

[HADOOP] hadoop에서 단어 수를 값으로 정렬하는 법? [복제]

HADOOP

hadoop에서 단어 수를 값으로 정렬하는 법? [복제]

안녕 나는 hadoop.i에 가치에 의해 단어 개수를 정렬하는 방법을 배우고 싶었는데, 값에 의해서가 아니라, 정렬 키를 가지고 있다는 것을 알고 있었다.

나는 파티셔너, 그룹화 비교자 및 sortcomparator가 있어야만하는 값을 정렬하는 것을 알고있다.

그러나 나는 가치 개념에 따라 단어 수를 정렬하기 위해이 개념을 적용하는 데 혼란스러워합니다.

우리는 같은 것을 달성하기 위해 또 다른지도 감축 작업을 필요로합니까? 그렇지 않으면 출현 횟수를 세고 여기에서 정렬하여 감속기에 방출하는 결합기가 필요합니까?

단어 수를 예제별로 정렬하는 방법을 설명 할 수 있습니까?

해결법

  1. ==============================

    1.두 번째지도 작업을해야합니다. 당신이 총계 (첫 번째 MR 업무가하는)에 대해 결론을 내리지 않는 한, 어떻게 가치 (단어의 수)로 분류하는 것을 생각할 수 있습니까? 논리적으로 불가능합니다.

    두 번째지도 작업을해야합니다. 당신이 총계 (첫 번째 MR 업무가하는)에 대해 결론을 내리지 않는 한, 어떻게 가치 (단어의 수)로 분류하는 것을 생각할 수 있습니까? 논리적으로 불가능합니다.

  2. ==============================

    2.이것을 보조 정렬이라고합니다. 자세한 내용은이 내용과이 부분을 참조하십시오.

    이것을 보조 정렬이라고합니다. 자세한 내용은이 내용과이 부분을 참조하십시오.

  3. from https://stackoverflow.com/questions/18403857/how-to-sort-word-count-by-value-in-hadoop by cc-by-sa and MIT license