하이브 테이블에로드하는 동안 csv의 첫 번째 줄 건너 뛰기

안녕하세요 친구,

나는 명령을 따르는 도움으로 하이브에 테이블을 만들었다.

CREATE TABLE db.test 
  ( 
     fname STRING, 
     lname STRING, 
     age   STRING, 
     mob   BIGINT 
  ) row format delimited fields terminated BY '\t' stored AS textfile;

이제 파일에서 테이블의 데이터를로드하려면 다음 명령을 사용하고 있습니다.

load data local inpath '/home/cluster/TestHive.csv' into table db.test;

문제는 모든 행이 삽입되는 것입니다. 첫 번째 행에는 열 이름 만 포함되어 있기 때문에 필요하지 않습니다.

첫 줄을 건너 뛰는 방법을 제안 해주세요.

미리 감사드립니다.

해결법

==============================
1.이것을 얻으려면 TBLPROPERTIES ( "skip.header.line.count"= "1") 인 하이브 속성을 사용할 수 있습니다. 당신은 또한 예제를 참조 할 수 있습니다 -

이것을 얻으려면 TBLPROPERTIES ( "skip.header.line.count"= "1") 인 하이브 속성을 사용할 수 있습니다. 당신은 또한 예제를 참조 할 수 있습니다 -
```
CREATE TABLE temp 
  ( 
     name STRING, 
     id   INT 
  ) 
row format delimited fields terminated BY '\t' lines terminated BY '\n' 
tblproperties("skip.header.line.count"="1"); 
```
==============================
2.이미 머리글이있는 테이블을 만든 사람들을 위해서. 다음은 같은 명령에 대한 alter 명령입니다.

이미 머리글이있는 테이블을 만든 사람들을 위해서. 다음은 같은 명령에 대한 alter 명령입니다.

ALTER TABLE tablename SET TBLPROPERTIES ( "skip.header.line.count"= "1");

from https://stackoverflow.com/questions/20813355/skip-first-line-of-csv-while-loading-in-hive-table by cc-by-sa and MIT license

'HADOOP' 카테고리의 다른 글

[HADOOP] hadoop으로 메모리 제한 지정하기 (0)	2019.06.06
[HADOOP] Hadoop - namenode가 시작되지 않습니다. (0)	2019.06.06
[HADOOP] Apache Spark : 파티션 당 레코드 수 얻기 (0)	2019.06.06
[HADOOP] 돼지 대 하이브 대 네이티브지도 감소 (0)	2019.06.06
[HADOOP] Json은 AVRO로 변환하지 않고 Java를 사용하여 마루판 형식으로 처리합니다 (Spark, Hive, Pig, Impala를 사용하지 않음). (0)	2019.06.06

복붙노트

[HADOOP] 하이브 테이블에로드하는 동안 csv의 첫 번째 줄 건너 뛰기

하이브 테이블에로드하는 동안 csv의 첫 번째 줄 건너 뛰기

해결법

1.이것을 얻으려면 TBLPROPERTIES ( "skip.header.line.count"= "1") 인 하이브 속성을 사용할 수 있습니다. 당신은 또한 예제를 참조 할 수 있습니다 -

2.이미 머리글이있는 테이블을 만든 사람들을 위해서. 다음은 같은 명령에 대한 alter 명령입니다.

'HADOOP' 카테고리의 다른 글

티스토리툴바