[HADOOP] 돼지 성능 측정
HADOOP돼지 성능 측정
나는 돼지 스크립트를 작성하고 하둡 클러스터를 실행합니다. 어떻게 전체 처리 시간을 측정 할 수 있을까? 나는 처음부터 끝까지 처리 시간을 얻을 수있는 명령이 있나요?
해결법
-
==============================
1.편집 : 시간 대안을 추가했습니다.
편집 : 시간 대안을 추가했습니다.
그것은 (초) 걸리는 시간을 알고 :
time pig <options>
또 다른 방법은 그것을 할 수 있습니다 :
d1=$(date +%s) pig <options> d2=$(date +%s) echo "$d2 - $d1" | bc
또는, 한 줄에 :
d1=$(date +%s) ; pig <options> ; d2=$(date +%s) ; echo "$d2 - $d1" | bc
당신은 또한 단지 돼지의 출력에서 좀 걸릴 수 있습니다. 당신은 당신이 볼 수 출력의 끝으로 명령 줄에서 돼지 스크립트를 실행하는 경우 :
HadoopVersion PigVersion UserId StartedAt FinishedAt Features ...
그런 다음 FinishedAt을 뺄 수 - StartedAt을.
from https://stackoverflow.com/questions/19434894/pig-performance-measurement by cc-by-sa and MIT license
'HADOOP' 카테고리의 다른 글
[HADOOP] 로컬 또는 맵리 듀스 모드에서 문제 실행 돼지 (0) | 2019.10.12 |
---|---|
[HADOOP] 하이브 / 최단 거리가 어떻게 디렉토리를 .staging 작업을 설정할 수 있습니까? (0) | 2019.10.11 |
[HADOOP] 원사 컨테이너 발사 실패 예외 mapred-site.xml의 구성 (0) | 2019.10.11 |
[HADOOP] 의 예외 클라우 데라 VM에서 튜토리얼 CSV 파일을 읽는 (0) | 2019.10.11 |
[HADOOP] 의 MapReduce에서 어떻게 감속기 매퍼 값 [중복] ArrayList를 보낼 (0) | 2019.10.11 |