복붙노트

[HADOOP] HDFS에 프로그램을 설치해야합니까?

HADOOP

HDFS에 프로그램을 설치해야합니까?

HDFS에 프로그램을 설치하거나 로컬로 유지해야합니까? 나는 이진 파일에 대해 이야기하고있다 :

실행 파일을 HDFS에 배포하면 실행 속도가 느려질 수 있으므로 나쁜 생각이라고 생각합니다. 나는 64Mo (Hadoop block size)보다 큰 파일에 대해서도 최악이라고 생각한다. 그러나, 나는 그것에 대한 ressources를 찾지 못했습니다. 또한 메모리 관리에 대한 결과를 알지 못합니다 (JAR 복사본이있는 각 노드에 대해 복제 된 Java 힙이 있습니까?)

해결법

  1. ==============================

    1.예, 이것이 YARN의 공유 캐시 뒤에있는 개념입니다.

    예, 이것이 YARN의 공유 캐시 뒤에있는 개념입니다.

    이렇게하는 주된 이유는 작업에 많은 자원이 묶여 있고 로컬 리소스로 네트워크 대역폭을 낭비하는 경우입니다.

    성능 영향을보다 자세히 이해하려면 Slideshare를 참조하십시오.

  2. from https://stackoverflow.com/questions/48863143/should-i-put-programs-on-hdfs by cc-by-sa and MIT license