[HADOOP] 복사하지 않고 데이터를 직접 hdfs로 스트리밍
HADOOP복사하지 않고 데이터를 직접 hdfs로 스트리밍
난 다른 옵션을 통해 내가 로컬 노드에 저장하지 않고 python을 사용하여 hdfs에 직접 쓸 수있는 다음 copyfromlocal를 사용하여 찾고 있는데요.
로컬 파일과 비슷한 hdfs 파일을 사용하고 다음과 같은 인수로 라인에 write 메소드를 사용하고 싶습니다.
hdfs_file = hdfs.create("file_tmp")
hdfs_file.write("Hello world\n")
위에서 설명한 유스 케이스와 비슷한 것이 있습니까?
해결법
-
==============================
1.임 파이썬 hdfs 라이브러리에 대해 확실하지 않지만, 항상 hadoop fs put 명령을 통해 스트리밍 할 수 있으며 '-'를 소스 파일 이름으로 사용하여 stdin에서 복사하는 것을 나타낼 수 있습니다.
임 파이썬 hdfs 라이브러리에 대해 확실하지 않지만, 항상 hadoop fs put 명령을 통해 스트리밍 할 수 있으며 '-'를 소스 파일 이름으로 사용하여 stdin에서 복사하는 것을 나타낼 수 있습니다.
hadoop fs -put - /path/to/file/in/hdfs.txt
from https://stackoverflow.com/questions/15454244/stream-data-into-hdfs-directly-without-copying by cc-by-sa and MIT license
'HADOOP' 카테고리의 다른 글
[HADOOP] Dockerized Hadoop 데이터 노드가 잘못된 IP 주소로 등록하는 이유는 무엇입니까? (0) | 2019.07.09 |
---|---|
[HADOOP] PHP에서 Hadoop 하이브 쿼리를 실행하는 방법 (0) | 2019.07.09 |
[HADOOP] 하이브 서비스, HiveServer2 & MetaStore 서비스? (0) | 2019.07.08 |
[HADOOP] newAPIHadoopFile에 대한 파티션 수를 설정하는 방법은 무엇입니까? (0) | 2019.07.08 |
[HADOOP] 스파크 스트리밍 출력 지속 (0) | 2019.07.08 |