복붙노트

[HADOOP] Ruby를 사용하여 Hadoop HDFS에서 파일을 쓰고 읽는 방법?

HADOOP

Ruby를 사용하여 Hadoop HDFS에서 파일을 쓰고 읽는 방법?

Ruby를 사용하여 HDFS API로 작업 할 수있는 방법이 있습니까? 내가 이해할 수있는 것처럼 다국어 파일 인 Api가 없으며 유일한 방법은 기본 Java API를 사용하는 것입니다. 내가 JRuby를 사용하여 시도했지만이 솔루션은 불안정하고별로 기본이 아닙니다. 또한 HDFS Thrift Api를 살펴 봤지만 완벽하지는 않으며 인덱싱 된 파일 작성과 같은 많은 기능이 부족합니다.

JRuby 또는 Thrift API를 사용하는 것 외에 Ruby를 사용하여 HDFS를 사용하는 방법이 있습니까?

해결법

  1. ==============================

    1.github에는 두 가지 프로젝트가 있습니다. ruby-hdfs는 Ruby 용 HDFS에 네이티브 C 바인딩을 제공합니다. ganapati는 Thrift 서버와 인터페이스합니다.

    github에는 두 가지 프로젝트가 있습니다. ruby-hdfs는 Ruby 용 HDFS에 네이티브 C 바인딩을 제공합니다. ganapati는 Thrift 서버와 인터페이스합니다.

    또한 파일 시스템 쉘에 직접 시스템 호출을 할 수 있습니다. 예 :

    cmd = "hadoop fs -mkdir #{hdfs_path}"
    cmd += " 2> /dev/null"
    system(cmd)
    if $? == 0
      puts 'ok'
      exit(0)
    else
      puts "Error: failed to create hdfs://#{hdfs_path}"
      exit(2)
    end
    
  2. from https://stackoverflow.com/questions/3125519/how-to-write-and-read-files-in-from-hadoop-hdfs-using-ruby by cc-by-sa and MIT license