[HADOOP] Ruby를 사용하여 Hadoop HDFS에서 파일을 쓰고 읽는 방법?
HADOOPRuby를 사용하여 Hadoop HDFS에서 파일을 쓰고 읽는 방법?
Ruby를 사용하여 HDFS API로 작업 할 수있는 방법이 있습니까? 내가 이해할 수있는 것처럼 다국어 파일 인 Api가 없으며 유일한 방법은 기본 Java API를 사용하는 것입니다. 내가 JRuby를 사용하여 시도했지만이 솔루션은 불안정하고별로 기본이 아닙니다. 또한 HDFS Thrift Api를 살펴 봤지만 완벽하지는 않으며 인덱싱 된 파일 작성과 같은 많은 기능이 부족합니다.
JRuby 또는 Thrift API를 사용하는 것 외에 Ruby를 사용하여 HDFS를 사용하는 방법이 있습니까?
해결법
-
==============================
1.github에는 두 가지 프로젝트가 있습니다. ruby-hdfs는 Ruby 용 HDFS에 네이티브 C 바인딩을 제공합니다. ganapati는 Thrift 서버와 인터페이스합니다.
github에는 두 가지 프로젝트가 있습니다. ruby-hdfs는 Ruby 용 HDFS에 네이티브 C 바인딩을 제공합니다. ganapati는 Thrift 서버와 인터페이스합니다.
또한 파일 시스템 쉘에 직접 시스템 호출을 할 수 있습니다. 예 :
cmd = "hadoop fs -mkdir #{hdfs_path}" cmd += " 2> /dev/null" system(cmd) if $? == 0 puts 'ok' exit(0) else puts "Error: failed to create hdfs://#{hdfs_path}" exit(2) end
from https://stackoverflow.com/questions/3125519/how-to-write-and-read-files-in-from-hadoop-hdfs-using-ruby by cc-by-sa and MIT license
'HADOOP' 카테고리의 다른 글
[HADOOP] 하둡 하이퍼 큐브 (0) | 2019.07.30 |
---|---|
[HADOOP] 우분투 마스터와 윈도우 슬레이브를 이용한 Hadoop 클러스터 설정 (0) | 2019.07.30 |
[HADOOP] 오류 : 생성자 htable (구성 문자열)이 사용되지 않습니다. (0) | 2019.07.30 |
[HADOOP] 복잡한 중첩 된 Json에 대한 하이브 (0) | 2019.07.30 |
[HADOOP] pyspark로 HBase로 스트리밍하기 (0) | 2019.07.30 |