복붙노트

[HADOOP] Hadoop의 Sort Comparator와 Group Comparator의 차이점은 무엇입니까?

HADOOP

Hadoop의 Sort Comparator와 Group Comparator의 차이점은 무엇입니까?

Hadoop의 Sort Comparator와 Group Comparator의 차이점은 무엇입니까?

해결법

  1. ==============================

    1.GroupComparator를 이해하려면이 질문에 대한 내 대답을 참조하십시오.

    GroupComparator를 이해하려면이 질문에 대한 내 대답을 참조하십시오.

    hadoop 맵에서 그룹 비교기를 사용하는 것은 무엇입니까 reduce

    SortComparator :지도 출력 키 정렬 방법을 정의하는 데 사용됩니다.

    이 책의 발췌본 Hadoop - Definitive Guide :

    키 정렬 순서는 다음과 같습니다.

    SortComparator Vs GroupComparator 한 라이너 : SortComparator는 GroupComparator가 Reducer 내의 출력 키가 동일한 reduce 메소드 호출로가는 것을 결정하는 동안지도 출력 키가 정렬되는 방법을 결정합니다.

  2. ==============================

    2.그룹 비교기는 어느지도 출력 키가 하나의 키로 통합 (그룹화) 될지 결정하며, 물론 모든 값 모음도 그룹화됩니다. 일반적으로 요약 수집을위한 유일한 키로 첫 번째 키를 사용합니다.

    그룹 비교기는 어느지도 출력 키가 하나의 키로 통합 (그룹화) 될지 결정하며, 물론 모든 값 모음도 그룹화됩니다. 일반적으로 요약 수집을위한 유일한 키로 첫 번째 키를 사용합니다.

    SortComparator는 reduce의 입력으로 키가 소트되는 방법을 결정합니다. 기본적으로 자연 순서 지정을 사용합니다.

  3. from https://stackoverflow.com/questions/16184745/what-are-the-differences-between-sort-comparator-and-group-comparator-in-hadoop by cc-by-sa and MIT license