복붙노트

[HADOOP] Hadoop의 단일 모드와 가상 분산 모드의 차이점은 무엇입니까?

HADOOP

Hadoop의 단일 모드와 가상 분산 모드의 차이점은 무엇입니까?

나는 이론적 관점뿐만 아니라 구성의 관점과 다른 점을 알고 싶습니다.

이 두 모드는 다른 포트 번호를 사용합니까? 또는 다른 어떤 차이가 있습니까?

해결법

  1. ==============================

    1.내 2 센트.

    내 2 센트.

    기본적으로 Hadoop은 비 분산 또는 독립 실행 형 모드에서 단일 Java 프로세스로 실행되도록 구성됩니다. 데몬이 실행되고 있지 않으며 모든 것이 단일 JVM 인스턴스에서 실행됩니다. HDFS는 사용되지 않습니다.

    JAVA_HOME을 제외하고 설정과 관련해서는 아무 것도 할 필요가 없습니다. 타르볼을 다운로드하고 압축을 풀면 좋은 결과를 얻을 수 있습니다.

    Hadoop 데몬은 로컬 시스템에서 실행되므로 소규모로 클러스터를 시뮬레이트합니다. 다른 Hadoop 데몬은 다른 JVM 인스턴스에서 실행되지만 단일 시스템에서만 실행됩니다. 로컬 FS 대신 HDFS가 사용됩니다.

    의사 배포 설정에 관한 한 JAVA_HOME과 함께 최소한 다음 두 가지 속성을 설정해야합니다.

    여러 개의 데이터 노드와 작업 추적기를 가질 수 있지만 단일 시스템에서는별로 의미가 없습니다.

    HTH

  2. ==============================

    2.단일 노드 설정은 단일 머신에 하나의 datanode와 하나의 tasktracker가있는 경우입니다 (아마도).

    단일 노드 설정은 단일 머신에 하나의 datanode와 하나의 tasktracker가있는 경우입니다 (아마도).

    가상 분산 설정은 한 대의 컴퓨터에 여러 개의 데이터 노드와 (아마도) tasktracker가있는 곳입니다. 따라서 다중 노드 클러스터를 에뮬레이트하기 위해 단일 시스템에서 실행중인 데이터 노드 서비스의 인스턴스가 여러 개 있습니다.

  3. from https://stackoverflow.com/questions/23435333/what-is-the-difference-between-single-node-pseudo-distributed-mode-in-hadoop by cc-by-sa and MIT license