[HADOOP] 하둡지도 / 줄이기 대 내장지도 / 줄이기
HADOOP하둡지도 / 줄이기 대 내장지도 / 줄이기
Hadoop 맵 / 축소 맵과 Mongo의 내장 맵 / 축소 맵을 사용하여 MongoDB의 맵 작업 / 축소 작업을 수행하는 주요 차이점은 무엇입니까?
어떤지도를 선택해야합니까 / 엔진을 줄입니까? mongodb에 저장된 데이터에 대한 각 엔진의 장단점은 무엇입니까?
해결법
-
==============================
1.저의 대답은 하둡 MR의 지식과 경험과 몽고 MR의 학습에 기초합니다. 주요 차이점을 확인한 다음 선택 기준을 정의하십시오. 차이점은 다음과 같습니다.
저의 대답은 하둡 MR의 지식과 경험과 몽고 MR의 학습에 기초합니다. 주요 차이점을 확인한 다음 선택 기준을 정의하십시오. 차이점은 다음과 같습니다.
위에서 나는 다음과 같은 선택 기준을 제안 할 수있다. Mongo DB MR을 선택하십시오. 단순한 그룹화가 필요하고 필터링이 필요하다면 맵과 축소 사이에 무거워 질 것입니다. 즉, 간단합니다.
복잡하고 계산적으로 강한 MR 작업 (예 : 일부 회귀 계산)을 수행하려면 hadoop MR을 선택하십시오. 지도와 축소 사이에 예측할 수없는 많은 양의 데이터를 가짐으로써 하둡 MR이 나왔다.
Java는 더 많은 라이브러리, 특히 통계적으로 더 강력한 언어입니다. 그것은 고려되어야합니다.
-
==============================
2.MongoDB 2.4 MapReduce 작업은 더 이상 단일 스레드가 아닙니다.
MongoDB 2.4 MapReduce 작업은 더 이상 단일 스레드가 아닙니다.
또한 MongoDB에서 집계 및 기타 분석 작업을 수행하는 고성능의 선언적 방법에 대해서는 Aggregation Framework를 참조하십시오.
-
==============================
3.항목 3은 Hadoop과 관련하여 분명히 부정확합니다. 데이터와 함께 colocation을 처리하는 것은 Hadoop의 기초입니다.
항목 3은 Hadoop과 관련하여 분명히 부정확합니다. 데이터와 함께 colocation을 처리하는 것은 Hadoop의 기초입니다.
-
==============================
4.Hadoop MR에 대한 많은 경험이 없지만, HDFS에서만 Mongo 데이터를 모두 복제해야한다는 인상을주었습니다. 모든 데이터를 복제하고자한다면 Hadoop MR이 Mongo MR보다 훨씬 빠르고 강력하다고 생각합니다.
Hadoop MR에 대한 많은 경험이 없지만, HDFS에서만 Mongo 데이터를 모두 복제해야한다는 인상을주었습니다. 모든 데이터를 복제하고자한다면 Hadoop MR이 Mongo MR보다 훨씬 빠르고 강력하다고 생각합니다.
from https://stackoverflow.com/questions/9287585/hadoop-map-reduce-vs-built-in-map-reduce by cc-by-sa and MIT license
'HADOOP' 카테고리의 다른 글
[HADOOP] HBase에 데이터를 프로그램 방식으로 대량로드하는 가장 빠른 방법은 무엇입니까? (0) | 2019.06.02 |
---|---|
[HADOOP] hadoop 2.2.0 64 비트 설치가 시작되지만 시작할 수 없음 (0) | 2019.06.02 |
[HADOOP] 데이터 노드가 시작되지 않았습니다. (0) | 2019.06.02 |
[HADOOP] 스파이크 데이터 프레임을 하이브에 동적 파티션 테이블로 저장 (0) | 2019.06.02 |
[HADOOP] 아파치 kafka [중복]에서 주제를 삭제하는 방법 (0) | 2019.06.02 |