[HADOOP] 하이브 하중 특정 열
HADOOP하이브 하중 특정 열
Hive에서 만든 테이블에 특정 열을로드하는 데 관심이 있습니다.
특정 열을 직접로드 할 수 있습니까? 아니면 모든 데이터를로드하고 두 번째 테이블을 작성하여 특정 열을 선택해야합니까?
감사
해결법
-
==============================
1.예, 다음과 같이 모든 데이터를로드해야합니다.
예, 다음과 같이 모든 데이터를로드해야합니다.
LOAD DATA [LOCAL] INPATH /Your/Path [OVERWRITE] INTO TABLE yourTable;
LOCAL은 파일이 HDFS가 아닌 로컬 시스템에 있음을 의미하며, OVERWRITE는 테이블의 현재 데이터가 삭제됨을 의미합니다.
따라서 필요한 필드만으로 두 번째 테이블을 만들고이 쿼리를 실행합니다.
INSERT OVERWRITE TABLE yourNewTable yourSelectStatement FROM yourOldTable;
-
==============================
2.Hive에서 외부 테이블을 만들고 보유한 데이터를 매핑 한 다음 특정 열이있는 새 테이블을 만들고 create table을 명령으로 사용하는 것이 좋습니다.
Hive에서 외부 테이블을 만들고 보유한 데이터를 매핑 한 다음 특정 열이있는 새 테이블을 만들고 create table을 명령으로 사용하는 것이 좋습니다.
create table table_name as select statement from table_name;
예를 들어 문장은 다음과 같습니다
create table employee as select id as id,emp_name as name from emp;
-
==============================
3.이 시도:
이 시도:
Insert into table_name ( #columns you want to insert value into in lowercase ) select columns_you_need from source_table;
from https://stackoverflow.com/questions/25032097/hive-load-specific-columns by cc-by-sa and MIT license
'HADOOP' 카테고리의 다른 글
[HADOOP] 새로 설치시 HDFS 공간 사용량 (0) | 2019.08.17 |
---|---|
[HADOOP] Oozie 워크 플로우에있는 MapReduce 작업에서 감속기 수 설정 (0) | 2019.08.17 |
[HADOOP] hbase MR 작업을 실행할 때 cdh5.2 클러스터에 FileNotFoundException이 발생합니다. (0) | 2019.08.17 |
[HADOOP] hadoop 다중 클러스터에서 SSH 기본 포트 변경 [닫힘] (0) | 2019.08.17 |
[HADOOP] hbase API를 사용하여 지역 이름을 얻는 올바른 방법 (0) | 2019.08.17 |