Hadoop 작업 : 작업이 601 초 동안 상태를보고하지 못합니다.

pseudoode에서 hadoop 작업을 실행하는 동안 작업이 실패하고 죽었습니다. 오류 : 작업 시도가 601 초 동안 상태를보고하지 못했습니다.

그러나 동일한 프로그램이 Eclipse (로컬 작업)를 통해 실행됩니다.

작업 : 약 25,000 개의 키워드가 있습니다. 한 번에 두 번씩 가능한 모든 조합 (예 : 약 25K * 25K 개 항목)

문제는 무엇이 될 수 있습니까?

해결법

==============================
1.웬일인지 의사 모드에서 실행될 때 작업이 진행되지 않습니다. mapred-site.xml에서 "mapred.task.timeout"설정을 늘릴 수 있습니다. mapred-default.xml 파일의 기본값은 다음과 같습니다.

웬일인지 의사 모드에서 실행될 때 작업이 진행되지 않습니다. mapred-site.xml에서 "mapred.task.timeout"설정을 늘릴 수 있습니다. mapred-default.xml 파일의 기본값은 다음과 같습니다.
```
 <property>
    <name>mapred.task.timeout</name>
    <value>600000</value>
    <description>The number of milliseconds before a task will be 
                 terminated if it neither reads an input, writes 
                 an output, nor updates its status string.
    </description>
 </property>
```
==============================
2.테스트 목적 / 일회성 작업 또는 디버깅의 경우 타임 아웃 값의 증가가 좋은 옵션 일 수 있지만 실습에 따르면 이것이 프로덕션을위한 좋은 해결책은 아니라고 판단하여 코드를 검토하고 최적화해야합니다.

테스트 목적 / 일회성 작업 또는 디버깅의 경우 타임 아웃 값의 증가가 좋은 옵션 일 수 있지만 실습에 따르면 이것이 프로덕션을위한 좋은 해결책은 아니라고 판단하여 코드를 검토하고 최적화해야합니다.
==============================
3.Hadoop 동일한 API에 대한보고 API를 제공합니다. 진행 상황을 hadoop 작업에 대해 600 분인 10 분 동안보고하지 않으면 작업이 갇혀있는 것으로 간주하여 작업을 종료합니다. API 참조는 여기에 있습니다.

Hadoop 동일한 API에 대한보고 API를 제공합니다. 진행 상황을 hadoop 작업에 대해 600 분인 10 분 동안보고하지 않으면 작업이 갇혀있는 것으로 간주하여 작업을 종료합니다. API 참조는 여기에 있습니다.

from https://stackoverflow.com/questions/9109177/hadoop-job-task-fail-to-report-status-for-601-seconds by cc-by-sa and MIT license

'HADOOP' 카테고리의 다른 글

[HADOOP] 로컬 hadoop과 푸른 하늘 방울 저장소와 연결할 수 없습니다 (0)	2019.07.22
[HADOOP] Pig를 사용하여 열의 JSON 문자열을 구문 분석하는 방법 (0)	2019.07.22
[HADOOP] Hive - 열 이름 가져 오기 (0)	2019.07.22
[HADOOP] JAVA를 통해 HIVE2에 연결할 수 없습니다. (0)	2019.07.22
[HADOOP] 이름 노드는 fsImage를 저장하고 로그를 편집합니까? (0)	2019.07.22

복붙노트

[HADOOP] Hadoop 작업 : 작업이 601 초 동안 상태를보고하지 못합니다.

Hadoop 작업 : 작업이 601 초 동안 상태를보고하지 못합니다.

해결법

1.웬일인지 의사 모드에서 실행될 때 작업이 진행되지 않습니다. mapred-site.xml에서 "mapred.task.timeout"설정을 늘릴 수 있습니다. mapred-default.xml 파일의 기본값은 다음과 같습니다.

2.테스트 목적 / 일회성 작업 또는 디버깅의 경우 타임 아웃 값의 증가가 좋은 옵션 일 수 있지만 실습에 따르면 이것이 프로덕션을위한 좋은 해결책은 아니라고 판단하여 코드를 검토하고 최적화해야합니다.

3.Hadoop 동일한 API에 대한보고 API를 제공합니다. 진행 상황을 hadoop 작업에 대해 600 분인 10 분 동안보고하지 않으면 작업이 갇혀있는 것으로 간주하여 작업을 종료합니다. API 참조는 여기에 있습니다.

'HADOOP' 카테고리의 다른 글

티스토리툴바