[HADOOP] HIVE 쿼리는 지역 저장 파일에서 데이터 가져 오기 후 null 값을 반환
HADOOPHIVE 쿼리는 지역 저장 파일에서 데이터 가져 오기 후 null 값을 반환
내 질문 :-) noobies 경우 그래서 부드러운 주시기 바랍니다 하이브 새로운 오전
내가 만들고 테이블에 데이터를로드하려면 다음 하이브 문을 사용합니다.
CREATE TABLE entities_extract (doc_id STRING, name STRING, type STRING, len STRING, offset STRING)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t'
LINES TERMINATED BY '\n'
STORED AS TEXTFILE
LOCATION '/research/45924/hive/entities_extract';
LOAD DATA LOCAL INPATH '/home/researcher/hadoop-runnables/files/entitie_extract_by_doc.txt' OVERWRITE INTO TABLE entities_extract;
해두 지금까지 너무 좋아, 나는이 스크립트를 실행 에러가 없습니다. 이상한 것은 내가 테이블에서 select *를 수행 할 때 내 결과가 null 값 4 여분의 열을 보여주고 있다는 것입니다
아래 같은 외모에 간다 데이터 :
USER.A-GovDocs-f83c6ca3-9585-4c66-b9b0-f4c3bd57ccf4 Chanko PERSON 6 41086
선택에서 반환 된 데이터는 다음과 같습니다 :
USER.A-GovDocs-f83c6ca3-9585-4c66-b9b0-f4c3bd57ccf4 Chanko PERSON 6 41086 NULL NULL NULL NULL
편집하다: "entitie_extract_by_doc.txt"의 작은 부분 집합 아래
USER.A-GovDocs-f83c6ca3-9585-4c66-b9b0-f4c3bd57ccf4 Berkowitz PERSON 9 385
USER.A-GovDocs-f83c6ca3-9585-4c66-b9b0-f4c3bd57ccf4 Marotolli PERSON 939420
USER.A-GovDocs-f83c6ca3-9585-4c66-b9b0-f4c3bd57ccf4 Corzatt PERSON 7 39772
USER.A-GovDocs-f83c6ca3-9585-4c66-b9b0-f4c3bd57ccf4 Berkowitz PERSON 9 40314
USER.A-GovDocs-f83c6ca3-9585-4c66-b9b0-f4c3bd57ccf4 Corzatt PERSON 7 40584
USER.A-GovDocs-f83c6ca3-9585-4c66-b9b0-f4c3bd57ccf4 Berkowitz PERSON 9 40840
USER.A-GovDocs-f83c6ca3-9585-4c66-b9b0-f4c3bd57ccf4 Rich PERSON 4 41038
USER.A-GovDocs-f83c6ca3-9585-4c66-b9b0-f4c3bd57ccf4 Lea PERSON 3 41044
USER.A-GovDocs-f83c6ca3-9585-4c66-b9b0-f4c3bd57ccf4 Anthony PERSON 7 41049
USER.A-GovDocs-f83c6ca3-9585-4c66-b9b0-f4c3bd57ccf4 Bill PERSON 4 41062
USER.A-GovDocs-f83c6ca3-9585-4c66-b9b0-f4c3bd57ccf4 Nelson PERSON 6 41067
USER.A-GovDocs-f83c6ca3-9585-4c66-b9b0-f4c3bd57ccf4 Barbara PERSON 7 41078
USER.A-GovDocs-f83c6ca3-9585-4c66-b9b0-f4c3bd57ccf4 Chanko PERSON 6 41086
난 이미 4 개 별도의 탭이 있다면보고 내 소스 데이터를 보면,하지만이 사건이 아니었다 ..
여기 누군가는이 4 개의 추가 열에서 온 어떤 생각을 가지고?
종류 안부
마티
해결법
-
==============================
1.당신은 같은 칼럼의 일부입니다 귀하의 문자열 데이터 내부에 수있는 \ n을 교체해야합니다. 그 여분 \ n을 추가 열을 생성 할 수있다.
당신은 같은 칼럼의 일부입니다 귀하의 문자열 데이터 내부에 수있는 \ n을 교체해야합니다. 그 여분 \ n을 추가 열을 생성 할 수있다.
select regexp_replace(mensaje,"\n"," ") from partido where id = "1e2af";
-
==============================
2.여기에 그렇게 위치를 언급 할 필요가 없습니다, 외부 테이블을 생성하지. 다음 정확한 값을 얻을 수, 쿼리에서 위치를 제거합니다.
여기에 그렇게 위치를 언급 할 필요가 없습니다, 외부 테이블을 생성하지. 다음 정확한 값을 얻을 수, 쿼리에서 위치를 제거합니다.
from https://stackoverflow.com/questions/14607507/hive-query-returning-null-values-after-import-data-from-local-stored-file by cc-by-sa and MIT license
'HADOOP' 카테고리의 다른 글
[HADOOP] 하둡 : 출력 파일을 두 번 출력을 가지고 (0) | 2019.10.12 |
---|---|
[HADOOP] 지도는 하둡 프레임 워크에서 데이터 구조를 구현하는 프로그램을 감소 (0) | 2019.10.12 |
[HADOOP] 수로 : 데이터가 서버로 전송 (0) | 2019.10.12 |
[HADOOP] 의 감속기의 비정상적인 행동 하둡에지도-감소? (0) | 2019.10.12 |
[HADOOP] 이상한 행동을 하둡 : 키에 대한 모든 값을하지 않는 기능을 감소 (0) | 2019.10.12 |