하이브 테이블을 Google BigQuery로 이전

하이브 테이블을 BigQuery로 마이그레이션하기 위해 일종의 데이터 파이프 라인을 설계하려고합니다. Hive는 전제 클러스터의 Hadoop에서 실행 중입니다. 이것은 현재의 디자인입니다. 실제로는 아주 쉽습니다. 쉘 스크립트 일뿐입니다.

각 테이블에 대해 source_hive_table {

}

그게 합리적이라고 생각하니? 스파크를 사용하는 것이 더 좋은 방법일까요? 캐스팅을 처리하는 방식에 만족하지 않아서 BigQuery 테이블을 두 번 생성하지 않으려합니다.

해결법

[HADOOP] Spark Streaming에서 출력 파일 이름 변경 (0)	2019.06.10
[HADOOP] Spark - 스파크 작업에 얼마나 많은 집행자와 코어가 할당되어 있습니까? (0)	2019.06.09
[HADOOP] java.lang.RuntimeException을 해결하는 방법 : PipeMapRed.waitOutputThreads () : 서브 프로세스가 코드 2로 실패 했습니까? (0)	2019.06.09
[HADOOP] Hadoop MapReduce 작업을 실행할 때 파일 이름 / 파일 내용을 MAP의 키 / 값 입력으로 가져 오는 방법은 무엇입니까? (0)	2019.06.09
[HADOOP] 파일은 언제 "분할 가능"합니까? (0)	2019.06.09