[HADOOP] 돼지 결과를 로컬 파일에 저장
HADOOP돼지 결과를 로컬 파일에 저장
돼지 스크립트를 실행하면 약간의 조작이 발생하고 출력 크기는 매우 작습니다.
지금 나는 달린다.
hadoop fs -getmerge ...
갈라져.
돼지 스크립트가 로컬 파일에 직접 결과를 덤프하도록하는 방법은 없나요?
해결법
-
==============================
1.모든 것을 하나의 파일에 병합하는 것에 대해 걱정하지 않는다면 grunt (http://wiki.apache.org/pig/Grunt)에서 copyToLocal 명령을 사용할 수 있습니다.
모든 것을 하나의 파일에 병합하는 것에 대해 걱정하지 않는다면 grunt (http://wiki.apache.org/pig/Grunt)에서 copyToLocal 명령을 사용할 수 있습니다.
grunt> copyToLocal <src> <dest>
-
==============================
2.또 다른 가능한 방법은 Pig를 Python 또는 JavaScript에 포함시키는 것입니다. 다음과 같이 (Python으로) 할 수 있습니다 :
또 다른 가능한 방법은 Pig를 Python 또는 JavaScript에 포함시키는 것입니다. 다음과 같이 (Python으로) 할 수 있습니다 :
import os from org.apache.pig.scripting import Pig P = Pig.compile("PUT YOUR PIG CODE HERE") hdfs_input = "YOUR HDFS INPUT" hdfs_output = "YOUR HDFS OUTPUT" local_output = "YOUR LOCAL OUTPUT" result = P.bind({'in': input, 'out': hdfs_output}).runSingle() os.system("hadoop fs -getmerge " + hdfs_output + " " + local_output)
그리고 파이썬 코드를 (예를 들어)
pig -useHCatalog python_code.py
from https://stackoverflow.com/questions/13685418/store-pig-result-to-local-file by cc-by-sa and MIT license
'HADOOP' 카테고리의 다른 글
[HADOOP] Greenplum, Pivotal HD + Spark, 또는 구조화 된 데이터의 결핵에 대한 HAWQ? (0) | 2019.07.29 |
---|---|
[HADOOP] 사용 보고서에서 트리플 복제에 대한 HDFS 계정은 어디에 있습니까? (0) | 2019.07.29 |
[HADOOP] Mapreduce 오류 : 로컬 디렉토리를 설정하지 못했습니다. (0) | 2019.07.29 |
[HADOOP] Hadoop 기본 'MapReduce 프로그램의 java.lang.NoClassDefFoundError (0) | 2019.07.29 |
[HADOOP] Hadoop과 돼지 관계 설정하기 (0) | 2019.07.29 |