복붙노트

[HADOOP] 5 기계와 아파치 Ambari 클러스터 물리적 시스템 또는 diffrent 5 VM으로 가상 머신에 설치 : 어느 것이 가장 좋습니다?

HADOOP

5 기계와 아파치 Ambari 클러스터 물리적 시스템 또는 diffrent 5 VM으로 가상 머신에 설치 : 어느 것이 가장 좋습니다?

안녕하세요 제가 5 기계의 VM을 생성 한 내 프로젝트 중 하나에 일하고는 개발 환경에서 잘 작동하지만 VM 클러스터에 대한 혼란을하는 것은 좋은 또는 물리적 시스템 클러스터로 이동해야합니다.

해결법

  1. ==============================

    1.하둡은 물리적 시스템을 위해 개발되었지만 가상 환경에서 성공의 학위를 변화와 함께 작동합니다, 그것은 특정 환경에 따라 달라집니다.

    하둡은 물리적 시스템을 위해 개발되었지만 가상 환경에서 성공의 학위를 변화와 함께 작동합니다, 그것은 특정 환경에 따라 달라집니다.

    이것은 실제로 하둡 메일 링리스트에 매우 일반적인 문제이며, 특히 하둡 위키 기사에 하둡 개발자에 의해 해결되었다 : 가상 하둡. 이 기사는 각각의 강점 / 약점을 커버뿐만 아니라 클라우드 구축에 대해 이야기합니다. 이 문서를 읽고 당신에 가을과 당신이 잠재적으로 VM 설정에서 할 수 있습니다 어떤 문제를 평가하는 배포 시나리오를 볼 수 있습니다.

  2. ==============================

    2.당신은 HDFS를위한 가상 머신을 사용하려는 경우, 복제 조심하세요. 기본적으로 저장에게 64 메가 바이트 덩어리의 모든 데이터를 HDFS 3 개 서로 다른 노드에 대한 모든 덩어리를 복제합니다. 또한, 적어도 하나 개의 복제는 다른 물리적 랙에 위치해야한다 - "랙 인식"기능을 참조하십시오. 가상화 된 데이터의 3 복제본이 하나의 물리적 호스트 / HDD에 위치 할 일이 있다면, 당신은 하드웨어 장애의 경우에 문제로 실행할 수 있습니다.

    당신은 HDFS를위한 가상 머신을 사용하려는 경우, 복제 조심하세요. 기본적으로 저장에게 64 메가 바이트 덩어리의 모든 데이터를 HDFS 3 개 서로 다른 노드에 대한 모든 덩어리를 복제합니다. 또한, 적어도 하나 개의 복제는 다른 물리적 랙에 위치해야한다 - "랙 인식"기능을 참조하십시오. 가상화 된 데이터의 3 복제본이 하나의 물리적 호스트 / HDD에 위치 할 일이 있다면, 당신은 하드웨어 장애의 경우에 문제로 실행할 수 있습니다.

    또 다른 잠재적주의해야 할 점은 I / O 성능을 할 수있다. 당신은 파일 기반 디스크 이미지 직접 디스크 액세스 VM 및하지를 사용하는 경우, I / O 오버 헤드가 상당 할 수 있습니다. 또한, 대부분의 경우, 가상 머신은 물리적 호스트에서 파일 시스템 캐시를 이용할 수 없습니다.

    반면에, VM 관리 및 프로비저닝은 쉽게해야합니다.

    그렇지 않으면, https://stackoverflow.com/a/44355754/1421254 대답을 참조하십시오.

  3. from https://stackoverflow.com/questions/44344195/which-one-is-best-apache-ambari-cluster-on-physical-system-with-5-machine-or-in by cc-by-sa and MIT license