복붙노트

[HADOOP] Sqoop을 통해 여러 소스에서 데이터를 가져 오는 방법

HADOOP

Sqoop을 통해 여러 소스에서 데이터를 가져 오는 방법

"Sqoop을 통해 여러 소스에서 데이터를 가져 오는 방법".

나는 이것에 대해 전혀 모른다.. 이것에 대한 메커니즘을 알려주십시오.

감사

해결법

  1. ==============================

    1.이것은 쉘 스크립트로 수행 할 수 있습니다.

    이것은 쉘 스크립트로 수행 할 수 있습니다.

    1) DBNAME.TABLENAME 목록이있는 입력 파일을 준비하십시오. 2) 쉘 스크립트는이 파일을 입력으로 가지고, 라인별로 반복하며 각 라인에 대해 sqoop 문을 실행합니다.

    while read line;
    do
    
        DBNAME=`echo $line | cut -d'.' -f1` 
        tableName=`echo $line | cut -d'.' -f2`
    
    
        sqoop import -Dmapreduce.job.queuename=$RM_QUEUE_NAME --connect '$JDBC_URL;databaseName=$DBNAME;username=$USERNAME;password=$PASSWORD' --table $tableName  --target-dir $DATA_COLLECTOR/$tableName  --fields-terminated-by '\001'  -m 1 
    
    done<inputFile
    
  2. from https://stackoverflow.com/questions/34966626/how-to-import-the-data-from-multiple-source-thru-sqoop by cc-by-sa and MIT license