[HADOOP] 돼지 성능 측정

2019. 10. 11. 21:49

cnpnote

HADOOP

돼지 성능 측정

나는 돼지 스크립트를 작성하고 하둡 클러스터를 실행합니다. 어떻게 전체 처리 시간을 측정 할 수 있을까? 나는 처음부터 끝까지 처리 시간을 얻을 수있는 명령이 있나요?

해결법

==============================
1.편집 : 시간 대안을 추가했습니다.

편집 : 시간 대안을 추가했습니다.

그것은 (초) 걸리는 시간을 알고 :
```
time pig <options>
```
또 다른 방법은 그것을 할 수 있습니다 :
```
d1=$(date +%s)
pig <options>
d2=$(date +%s)
echo "$d2 - $d1" | bc
```
또는, 한 줄에 :
```
d1=$(date +%s) ; pig <options> ; d2=$(date +%s) ; echo "$d2 - $d1" | bc
```
당신은 또한 단지 돼지의 출력에서 좀 걸릴 수 있습니다. 당신은 당신이 볼 수 출력의 끝으로 명령 줄에서 돼지 스크립트를 실행하는 경우 :
```
HadoopVersion   PigVersion  UserId  StartedAt   FinishedAt  Features
...
```
그런 다음 FinishedAt을 뺄 수 - StartedAt을.

from https://stackoverflow.com/questions/19434894/pig-performance-measurement by cc-by-sa and MIT license

'HADOOP' 카테고리의 다른 글

[HADOOP] 로컬 또는 맵리 듀스 모드에서 문제 실행 돼지 (0)	2019.10.12
[HADOOP] 하이브 / 최단 거리가 어떻게 디렉토리를 .staging 작업을 설정할 수 있습니까? (0)	2019.10.11
[HADOOP] 원사 컨테이너 발사 실패 예외 mapred-site.xml의 구성 (0)	2019.10.11
[HADOOP] 의 예외 클라우 데라 VM에서 튜토리얼 CSV 파일을 읽는 (0)	2019.10.11
[HADOOP] 의 MapReduce에서 어떻게 감속기 매퍼 값 [중복] ArrayList를 보낼 (0)	2019.10.11

,

티스토리툴바