세미콜론으로 구분 된 필드가있는 하나의 열이있는 .csv 파일에서 Hive 테이블을 만들려면 어떻게해야합니까?

나는 하이브 테이블에서 원하는 5 개의 필드가있는 하나의 (첫 번째) 열 / 셀 형식으로 .csv 파일을 세미콜론으로 구분하여 가지고 있습니다. 이렇게 :

ISBN;"Title";"Author";"Year";"Publisher"
0002005018;"Clara Callan";"Richard Bruce Wright";"2001";"HarperFlamingo Canada"
0399135782;"The Kitchen God's Wife";"Amy Tan";"1991";"Putnam Pub Group"

etc. 
etc.
...

Hive 쿼리를 사용하여 데이터를 나눌 수 있습니까? 동일한 순서의 열 이름으로 만든 테이블에 저장합니까?

regexp_extract처럼? 아니면 serde를 사용해야합니까?

Hadoop / hive / beeswax를 처음 사용하고 Cloudera-quickstart vm 5.2를 사용하고 있습니다.

해결법

==============================

1.다음과 같이하고 싶은 것처럼 들립니다.

다음과 같이하고 싶은 것처럼 들립니다.

CREATE TABLE books (ISBN STRING, Title STRING, Author STRING, Year STRING, Publisher STRING)
  ROW FORMAT DELIMITED FIELDS TERMINATED BY "\;";
LOAD DATA INPATH '/path/to/your/datafile' INTO TABLE books;

from https://stackoverflow.com/questions/27616764/how-can-i-make-a-hive-table-from-a-csv-file-which-has-one-column-with-fields-de by cc-by-sa and MIT license

'HADOOP' 카테고리의 다른 글

[HADOOP] org.apache.hadoop.mapreduce.Job에 대한 Hadoop MultipleOutputFormat 지원 (0)	2019.08.17
[HADOOP] Hadoop은 다시 시작될 때 MapReduce 기록을 제거합니다. (0)	2019.08.17
[HADOOP] HADOOP mapreduce pgm을 사용하여 각 텍스트 값을 XML로 계산 (0)	2019.08.17
[HADOOP] Hadoop Array로 작성된 값 읽기 (0)	2019.08.17
[HADOOP] Mapper를 Multi thread Mapper로 교체 할 때 키와 키가 일치하지 않는 유형 (0)	2019.08.17

복붙노트

[HADOOP] 세미콜론으로 구분 된 필드가있는 하나의 열이있는 .csv 파일에서 Hive 테이블을 만들려면 어떻게해야합니까?

세미콜론으로 구분 된 필드가있는 하나의 열이있는 .csv 파일에서 Hive 테이블을 만들려면 어떻게해야합니까?

해결법

1.다음과 같이하고 싶은 것처럼 들립니다.

'HADOOP' 카테고리의 다른 글

티스토리툴바