[HADOOP] pydoop 대 hadoopy - hadoop 파이썬 클라이언트 [닫기]
HADOOPpydoop 대 hadoopy - hadoop 파이썬 클라이언트 [닫기]
파이썬 클라이언트에서 Hadoop을 검색하는 동안 두 개의 모듈 pydoop 및 hadoopy가 발견되었습니다. 둘 다 작업하기에 충분하지만 어느 것을 설치하는 것이 더 많은 이점이 있는지 확실하지 않습니다.
해결법
-
==============================
1.가장 포괄적 인 문서는 http://blog.cloudera.com/blog/2013/01/a-guide-to-python-frameworks-for-hadoop/입니다.
가장 포괄적 인 문서는 http://blog.cloudera.com/blog/2013/01/a-guide-to-python-frameworks-for-hadoop/입니다.
최근에 저는 mrjob이 명백한 선두 주자로 나왔다고 생각합니다. 그것은 매우 활동적인 메일 링리스트를 가지고 있으며 상대적으로 안정적이고 최신의 것 같습니다. Amazon EMR과도 잘 통합되어 있습니다.
from https://stackoverflow.com/questions/21754728/pydoop-vs-hadoopy-hadoop-python-client by cc-by-sa and MIT license
'HADOOP' 카테고리의 다른 글
[HADOOP] ArrayList 요소에 반복 가능 (0) | 2019.08.02 |
---|---|
[HADOOP] HDFS에 쓰기 : 파일을 덮어 씁니다. (0) | 2019.08.02 |
[HADOOP] Hadoop 웹 사용자 : 해당 사용자 없음 (0) | 2019.08.02 |
[HADOOP] 파일 이름의 재발없이 hadoop 역 색인 (0) | 2019.08.02 |
[HADOOP] 문자 메시지에서 문자열의 돼지 수 발생 (0) | 2019.08.02 |