[HADOOP] 하둡에 ElasticSearch 쿼리를 전달하는 방법
HADOOP하둡에 ElasticSearch 쿼리를 전달하는 방법
나는 하둡에서 검색 할 수 있도록 프로젝트를 진행하고있다. 어떻게 쿼리가 처음과 같이, 그 결과 ID를 다시 SQL에 전달, ES에 전달되어 작동합니다 :
SELECT ... WHERE id in [1,24,383,2912,...]
우리가 SQL 온 하둡에 전달하는 100 개 또는 1000 ID를 가질 때 아니지만 너무 잘 우리가 전달하는 100K 또는 1M + ID를 가지고있는 경우, 잘 작동합니다. 다시 SQL로 ES에서 결과 집합 (ID의 목록을?) 전달하는 몇 가지 다른 방법은 무엇입니까?
해결법
-
==============================
1.별도의 테이블에있는 모든 탄성 검색 ID를 삽입 한 후 소스 테이블로 가입 할 수 있습니다.
별도의 테이블에있는 모든 탄성 검색 ID를 삽입 한 후 소스 테이블로 가입 할 수 있습니다.
EG
CREATE TABLE ELASTIC_SEARCH_ID(id INT); SELECT ... FROM SOURCE S JOIN ELASTIC_SEARCH_ID ES ON S.ID=ES.ID;
from https://stackoverflow.com/questions/42102034/how-to-pass-elasticsearch-query-to-hadoop by cc-by-sa and MIT license
'HADOOP' 카테고리의 다른 글
[HADOOP] Sqoop2 서버를 시작 하둡 구성 클래스를 찾을 수 없습니다 (1.99.7) (0) | 2019.10.20 |
---|---|
[HADOOP] 일식을 통합하고 2.6 하둡하는 방법 (0) | 2019.10.20 |
[HADOOP] 동적 oozie 파라미터를 계산 (MR의 행동 이경 수) (0) | 2019.10.20 |
[HADOOP] 하이브 오류 : java.lang.Exception 상위 : 자식 오류 (0) | 2019.10.20 |
[HADOOP] 어떻게 HBase를에 플랫 파일 (안 구분 된 파일)을로드? (0) | 2019.10.20 |