복붙노트

[HADOOP] pydoop 대 hadoopy - hadoop 파이썬 클라이언트 [닫기]

HADOOP

pydoop 대 hadoopy - hadoop 파이썬 클라이언트 [닫기]

파이썬 클라이언트에서 Hadoop을 검색하는 동안 두 개의 모듈 pydoop 및 hadoopy가 발견되었습니다. 둘 다 작업하기에 충분하지만 어느 것을 설치하는 것이 더 많은 이점이 있는지 확실하지 않습니다.

해결법

  1. ==============================

    1.가장 포괄적 인 문서는 http://blog.cloudera.com/blog/2013/01/a-guide-to-python-frameworks-for-hadoop/입니다.

    가장 포괄적 인 문서는 http://blog.cloudera.com/blog/2013/01/a-guide-to-python-frameworks-for-hadoop/입니다.

    최근에 저는 mrjob이 명백한 선두 주자로 나왔다고 생각합니다. 그것은 매우 활동적인 메일 링리스트를 가지고 있으며 상대적으로 안정적이고 최신의 것 같습니다. Amazon EMR과도 잘 통합되어 있습니다.

  2. from https://stackoverflow.com/questions/21754728/pydoop-vs-hadoopy-hadoop-python-client by cc-by-sa and MIT license