[HADOOP] Hadoop 프로세스 분할 지정

2019. 7. 31. 22:37

cnpnote

HADOOP

Hadoop 프로세스 분할 지정

내 텍스트 파일의 작은 부분에 Hadoop MapReduce를 실행하고 싶습니다.

내 임무 중 하나가 실패하고 있습니다. 로그에서 읽을 수 있습니다 :

이 파일의 MapReduce를 다시 3556769792에서 3623878656 (3556769792 + 67108864) 오프셋으로 실행할 수 있습니까?

해결법

==============================
1.방법은 오프셋 정의 파일을 복사하여 HDFS에 다시 추가하는 것입니다. 이 시점에서이 블록에서만 mapreduce 작업을 실행하면됩니다.

방법은 오프셋 정의 파일을 복사하여 HDFS에 다시 추가하는 것입니다. 이 시점에서이 블록에서만 mapreduce 작업을 실행하면됩니다.

1) 오프셋에서 파일 복사 3556769792에 따라 67108864 :

2) HDFS로 가져 오기

3) MapReduce를 다시 실행하십시오.

from https://stackoverflow.com/questions/18841786/specify-hadoop-process-split by cc-by-sa and MIT license

https://cngone.clickn.co.kr/광고

시앤지원 Vmware파트너사,GreenPlum,빅데이터 전문업체

https://keywordsolution.co.kr광고

리워드 광고 순위 최적화 스토어 순위 광고 전문 SEO 검색 엔진 최적화, 네이버 쇼핑, 쿠팡, 오늘의집, 카카오 순위 광고 전문

'HADOOP' 카테고리의 다른 글

[HADOOP] 클라이언트 컴퓨터에서 hadoop api 구성 (0)	2019.08.01
[HADOOP] 하나의 스크립트를 사용하여 여러 달 동안 하이브 파티션 만들기 (0)	2019.07.31
[HADOOP] 할프 질문 (0)	2019.07.31
[HADOOP] 하이브의 열에있는 카테고리의 비율 계산 (0)	2019.07.31
[HADOOP] 마스터는 원사로 시작해야합니다. (0)	2019.07.31

,

복붙노트 개발을 배울 때 처음부터 이해하고 코드를 쓰는 것은 무척 어렵습니다. 우선 Copy & Paste ( 복사 붙여넣기. : 복붙) 해 보시고, 어떻게 작동하는지 확인하세요. 가장 실력이 빠르게 느는 방법은 "직접 해보는 것" 입니다.

티스토리툴바