복붙노트

[HADOOP] 하이브에서는 가시 문자 구분 기호가 인식되지 않습니다

HADOOP

하이브에서는 가시 문자 구분 기호가 인식되지 않습니다

포스트에서 언급했듯이 Hive에서 아이슬란드 어 가시 문자를 구분 기호로 사용 가시 문자 구분 기호는 Hive에서 인식되지 않습니다

샘플 테이블

존재하지 않는 경우 외부 테이블 작성 zzzzz_raw (   spot_id INT,   activity_type_id INT,   activity_type STRING,   activity_id INT,   activity_sub_type STRING,   report_name STRING,   tag_method_id INT ) 참여자 (dt DATE) '\ -2'로 종료 된 행 형식 제한 필드 '\ n'으로 종료 된 행 텍스트 파일로 저장 위치 '/ raw / data / networkmatchtablesactivity / activity_cat';

산출

activity_cat_raw 한도 1에서 *를 선택하십시오.

4552126þ805759þeaasv101þ2275868þbfeaac01þBF_EA Access_Info Pageþ2       NULL    NULL    NULL    NULL    NULL    NULL    2015-03-24

뭔가 빠졌습니까?

해결법

  1. ==============================

    1.답을 찾았습니다. '-2'(thorn delimiter) 대신 '-61'구분 기호를 사용한 다음 하위 문자열을 사용하여 추가 기호를 제거했습니다.

    답을 찾았습니다. '-2'(thorn delimiter) 대신 '-61'구분 기호를 사용한 다음 하위 문자열을 사용하여 추가 기호를 제거했습니다.

    SSSSSS가 존재하지 않는 경우 외부 테이블 생성 (   spot_id STRING,   activity_type_id STRING,   activity_type STRING,   activity_id STRING,   activity_sub_type STRING,   report_name STRING,   tag_method_id STRING ) 참여자 (dt STRING) '\ -61'에 의해 종료 된 행 형식 제한 필드 '\ n'에 의해 종료 된 행 텍스트 파일로 저장 위치 'SSSSSS';

    그런 다음 하위 문자열을 사용하여 다른 기호를 제거하십시오.

    덮어 쓰기 표 삽입 vvvvvv 파티션 (dt)  spot_id STRING을 (를) 선택하십시오.   substr (activity_type_id, 2),   dt   SSSSS에서

    도움이 되길 바랍니다 ..

  2. from https://stackoverflow.com/questions/30245214/thorn-character-delimiter-is-not-recognized-in-hive by cc-by-sa and MIT license