복붙노트

[HADOOP] SQLClient에서는 하이브 테이블에 액세스하지만 퍼티에서는 액세스하지 않습니다.

HADOOP

SQLClient에서는 하이브 테이블에 액세스하지만 퍼티에서는 액세스하지 않습니다.

나는 Hive, MapReduce 및 Hadoop을 처음 사용합니다. 나는 퍼티를 사용하여 하이브 테이블에 연결하고 테이블의 레코드에 액세스합니다. 그래서 제가 한 것은 퍼티를 열고 호스트 이름에 vip.name.com을 입력 한 다음 Open을 클릭합니다. 그리고 나서 내 사용자 이름과 암호를 입력 한 다음 Hive sql을 사용하기위한 몇 가지 명령을 입력했습니다. 아래 목록은 내가 한 일이다.

$ bash
bash-3.00$ hive
Hive history file=/tmp/rkost/hive_job_log_rkost_201207010451_1212680168.txt
hive> set mapred.job.queue.name=mdhi-technology;
hive> select * from table LIMIT 1;

그래서 내 질문은 -

명령 프롬프트에서 Sql Developer 나 Squirel SQL Client와 같은 SQL 클라이언트를 사용하는 대신 다른 방법을 사용할 수 있습니까? 그리고 그곳에 있다면 퍼티에서 vip.name.com에 로깅 할 때 나의 예제를 고려해 볼 때 이것을 수행하는 단계별 절차는 무엇입니까?

그리고 내 윈도우 머신에서 JDBC 프로그램을 통해해야한다면 똑같은 방법으로 할 수있다. JDBC 프로그램을 사용하면 하이브 테이블에 액세스하여 결과를 다시 얻을 수 있습니다. 내가 오라클 테이블을 가지고 이것을 어떻게 할 수 있는지 아는 것처럼. 하지만이 호스트 이름 vip.name.com을 퍼티에 로그인 할 때 사용하는 유일한 혼란이 있습니다. 나는 그 질문이 분명하기를 희망한다. 모든 제안을 주시면 감사하겠습니다.

짧은 내 질문에 - 퍼티에서 로깅 대신 모든 SQLClient에서 동일한 작업을 수행 할 수 있습니까?

최신 정보-

마크가 제안한 방식대로 노력했습니다. 하지만 난 항상 - 하이브 : vip.host.com:10000/default에 연결을 설정할 수 없습니다 : java.net.ConnectionException : 연결 시간 초과 : 연결

해결법

  1. ==============================

    1.Putty로하고있는 일은 하이브가 설치된 시스템에 SSH를 설치하는 것입니다. 그런 다음 하이브 명령 줄에서 하이브 쿼리를 실행합니다. 그것이 하이브 쿼리를 발행하는 한 가지 방법입니다. SSH를 필요로하지 않는 다른 방법이 있습니다. 아마도 JDBC를 통한 연결이 필요할 것입니다.

    Putty로하고있는 일은 하이브가 설치된 시스템에 SSH를 설치하는 것입니다. 그런 다음 하이브 명령 줄에서 하이브 쿼리를 실행합니다. 그것이 하이브 쿼리를 발행하는 한 가지 방법입니다. SSH를 필요로하지 않는 다른 방법이 있습니다. 아마도 JDBC를 통한 연결이 필요할 것입니다.

    다음은 JDBC를 통해 SQuirreL을 사용하여 Amazon의 EMR 클러스터에서 하이브 설치에 연결하는 방법을 설명하는 문서입니다. 이 기사는 아마존에만 한정된 것으로 보일지 모르지만 그렇지 않습니다. 클러스터의 노드 중 하나에서 하이브 서버를 실행하고 클라이언트 시스템과 하이브를 실행하는 방화벽 간의 연결을 방해하지 않는 한 연결할 수 있어야합니다.

    위 링크와 관련하여 염두에 두어야 할 몇 가지 사항은 다음과 같습니다.

  2. from https://stackoverflow.com/questions/11278040/access-hive-tables-in-sqlclient-but-not-from-the-putty by cc-by-sa and MIT license