복붙노트

[HADOOP] hadoop 클러스터에서 하이브를 모든 노드에 설치해야합니까?

HADOOP

hadoop 클러스터에서 하이브를 모든 노드에 설치해야합니까?

저는 Hadoop / Hive의 초보자이며 방금 문서를 읽기 시작했습니다. Hadoop을 클러스터 모드로 설치하는 데는 많은 블로그가 있습니다. 또한 Hive가 Hadoop 위에서 실행된다는 것도 알고 있습니다. 제 질문은 Hadoop이 모든 클러스터 노드에 설치되어 있다는 것입니다. 또한 모든 클러스터 노드 또는 마스터 노드에만 Hive를 설치해야합니까?

해결법

  1. ==============================

    1.아니요, 작업자 노드에 설치하는 것이 아닙니다. Hive는 Hadoop 클라이언트입니다. 하이브 사이트에서 볼 수있는 지침에 따라 하이브를 실행하십시오.

    아니요, 작업자 노드에 설치하는 것이 아닙니다. Hive는 Hadoop 클라이언트입니다. 하이브 사이트에서 볼 수있는 지침에 따라 하이브를 실행하십시오.

  2. ==============================

    2.클러스터에 하이브를 설치할 필요가 없으며, 클라이언트 시스템은 작업을 제출하기 위해 하이브를 요구합니다. Cloudera 하이브 설치 가이드

    클러스터에 하이브를 설치할 필요가 없으며, 클라이언트 시스템은 작업을 제출하기 위해 하이브를 요구합니다. Cloudera 하이브 설치 가이드

  3. ==============================

    3.Hive는 기본적으로 Hadoop에서 구조화 된 데이터와 반 구조화 된 데이터를 처리하는 데 사용됩니다. Hive를 사용하여 HDFS 및 Amazon S3 파일 시스템에있는 대규모 데이터 세트의 분석을 수행 할 수도 있습니다. 데이터 하이브를 쿼리하기 위해 SQL과 유사한 HiveQL이라는 쿼리 언어도 제공합니다. Hive를 사용하면 데이터 분석을 위해 Ad-hoc 쿼리를 쉽게 실행할 수 있습니다. Hive를 사용하면 복잡한 Map-Reduce 작업을 작성할 필요가 없으며 SQL 쿼리를 제출하면됩니다. Hive는 이러한 SQL 쿼리를 MapReduce 작업으로 변환합니다.

    Hive는 기본적으로 Hadoop에서 구조화 된 데이터와 반 구조화 된 데이터를 처리하는 데 사용됩니다. Hive를 사용하여 HDFS 및 Amazon S3 파일 시스템에있는 대규모 데이터 세트의 분석을 수행 할 수도 있습니다. 데이터 하이브를 쿼리하기 위해 SQL과 유사한 HiveQL이라는 쿼리 언어도 제공합니다. Hive를 사용하면 데이터 분석을 위해 Ad-hoc 쿼리를 쉽게 실행할 수 있습니다. Hive를 사용하면 복잡한 Map-Reduce 작업을 작성할 필요가 없으며 SQL 쿼리를 제출하면됩니다. Hive는 이러한 SQL 쿼리를 MapReduce 작업으로 변환합니다.

    마지막으로 Hive SQL은 MapReduce 작업으로 변환 될 것이고 우리는 Hadoop 클러스터의 모든 노드에 Hive를 설치하지 않아도되는 것과 같은 방식으로 Hadoop 클러스터의 모든 노드에서 MapReduce 작업을 제출할 필요가 없습니다

  4. from https://stackoverflow.com/questions/8456141/in-a-hadoop-cluster-should-hive-be-installed-on-all-nodes by cc-by-sa and MIT license