복붙노트

[HADOOP] Hadoop과 돼지 관계 설정하기

HADOOP

Hadoop과 돼지 관계 설정하기

Hadoop과 Pig의 관계를 이해하는 데 어려움을 겪고 있습니다. 돼지의 목적은 스크립팅 언어 인 Pig Latin 뒤에 MapReduce 패턴을 숨기는 것입니다.

Hadoop과 Pig가 어떻게 연결되어 있는지 이해할 수 없습니다. 지금까지 유일한 설치 절차는 돼지가 주 허브 노드와 동일한 시스템에서 실행된다고 가정하는 것입니다. 실제로, hadoop 설정 파일을 사용합니다.

이것은 돼지가 스크립트를 mapreduce 코드로 변환하고이를 hadoop에 보내기 만하기 때문입니까?

그렇다면 Pig를 멀리있는 서버로 보내도록 Pig를 어떻게 구성 할 수 있습니까?

그렇지 않다면, 우리가 항상 돼지 안에서 뛰기를 필요로한다는 것을 의미합니까?

해결법

  1. ==============================

    1.돼지는 두 가지 모드로 실행할 수 있습니다.

    돼지는 두 가지 모드로 실행할 수 있습니다.

    따라서 모든 시스템에 Pig를 설치하고 원격 클러스터에 연결할 수 있습니다. Pig에는 Hadoop 클라이언트가 포함되어 있으므로 Phe를 사용하기 위해 Hadoop을 설치할 필요가 없습니다.

  2. from https://stackoverflow.com/questions/23832085/configuring-pig-relation-with-hadoop by cc-by-sa and MIT license