복붙노트

[HADOOP] JobControl를 사용하여 하둡 작업 시간을 측정

HADOOP

JobControl를 사용하여 하둡 작업 시간을 측정

나는 다음 내 하둡 작업을 실행하는 데 사용

long start = new Date().getTime();
boolean status = job.waitForCompletion(true);            
long end = new Date().getTime();

이 방법은 내가 내 코드에서 직접 끝나면 작업 걸리는 시간을 측정 할 수있다.

지금 나는 내 작업 간 종속성을 표현하기 위해 JobControl를 사용해야합니다 :

JobControl jobControl = new JobControl("MyJob");
jobControl.addJob(job1);
jobControl.addJob(job2);
job3.addDependingJob(job2);
jobControl.addJob(job3);

jobControl.run();

jobControl.run ()가 실행 된 그러나 일단 코드는 그래서 작업의 완료에 대한 jobControl.getState ()을 폴링하는 코드를 포함 할 수 없습니다 더 나아가 없다.

어떻게 JobControl를 사용하여 작업 걸리는 시간을 측정 할 수 있습니까?

해결법

  1. ==============================

    1.JobControl는 후크와이 정보를 얻을 수 있도록 더 좋은 기능이 없습니다. 당신이 시도하는 일부 (잠재적으로 고통스러운) 옵션이 있습니다 :

    JobControl는 후크와이 정보를 얻을 수 있도록 더 좋은 기능이 없습니다. 당신이 시도하는 일부 (잠재적으로 고통스러운) 옵션이 있습니다 :

  2. from https://stackoverflow.com/questions/10119460/measure-hadoop-job-time-using-jobcontrol by cc-by-sa and MIT license