[HADOOP] Sqoop을 통해 여러 소스에서 데이터를 가져 오는 방법
HADOOPSqoop을 통해 여러 소스에서 데이터를 가져 오는 방법
"Sqoop을 통해 여러 소스에서 데이터를 가져 오는 방법".
나는 이것에 대해 전혀 모른다.. 이것에 대한 메커니즘을 알려주십시오.
감사
해결법
-
==============================
1.이것은 쉘 스크립트로 수행 할 수 있습니다.
이것은 쉘 스크립트로 수행 할 수 있습니다.
1) DBNAME.TABLENAME 목록이있는 입력 파일을 준비하십시오. 2) 쉘 스크립트는이 파일을 입력으로 가지고, 라인별로 반복하며 각 라인에 대해 sqoop 문을 실행합니다.
while read line; do DBNAME=`echo $line | cut -d'.' -f1` tableName=`echo $line | cut -d'.' -f2` sqoop import -Dmapreduce.job.queuename=$RM_QUEUE_NAME --connect '$JDBC_URL;databaseName=$DBNAME;username=$USERNAME;password=$PASSWORD' --table $tableName --target-dir $DATA_COLLECTOR/$tableName --fields-terminated-by '\001' -m 1 done<inputFile
from https://stackoverflow.com/questions/34966626/how-to-import-the-data-from-multiple-source-thru-sqoop by cc-by-sa and MIT license
'HADOOP' 카테고리의 다른 글
[HADOOP] PIG는 텍스트 라인을 희소 벡터로 변환 (0) | 2019.08.11 |
---|---|
[HADOOP] 하나의 테이블에서 select를 실행할 때 전체 데이터베이스를 잠급니다. (0) | 2019.08.11 |
[HADOOP] Hadoop의 예제 작업을 실행하는 동안 ClassNotFoundException (0) | 2019.08.11 |
[HADOOP] 쿼리가 실행될 때 하이브가 hadoop을 실행합니까? (0) | 2019.08.11 |
[HADOOP] 하둡 스트리밍 작업을 시작하는 다른 방법 (0) | 2019.08.11 |