복붙노트

[HADOOP] 돼지 성능 측정

HADOOP

돼지 성능 측정

나는 돼지 스크립트를 작성하고 하둡 클러스터를 실행합니다. 어떻게 전체 처리 시간을 측정 할 수 있을까? 나는 처음부터 끝까지 처리 시간을 얻을 수있는 명령이 있나요?

해결법

  1. ==============================

    1.편집 : 시간 대안을 추가했습니다.

    편집 : 시간 대안을 추가했습니다.

    그것은 (초) 걸리는 시간을 알고 :

    time pig <options>
    

    또 다른 방법은 그것을 할 수 있습니다 :

    d1=$(date +%s)
    pig <options>
    d2=$(date +%s)
    echo "$d2 - $d1" | bc
    

    또는, 한 줄에 :

    d1=$(date +%s) ; pig <options> ; d2=$(date +%s) ; echo "$d2 - $d1" | bc
    

    당신은 또한 단지 돼지의 출력에서 ​​좀 걸릴 수 있습니다. 당신은 당신이 볼 수 출력의 끝으로 명령 줄에서 돼지 스크립트를 실행하는 경우 :

    HadoopVersion   PigVersion  UserId  StartedAt   FinishedAt  Features
    ...
    

    그런 다음 FinishedAt을 뺄 수 - StartedAt을.

  2. from https://stackoverflow.com/questions/19434894/pig-performance-measurement by cc-by-sa and MIT license