복붙노트

[HADOOP] Pig 사용자 정의 행 / 레코드 구분 기호를 사용하여 파일 저장

HADOOP

Pig 사용자 정의 행 / 레코드 구분 기호를 사용하여 파일 저장

레코드 구분 기호로 ctrlB가있는 파일이 있습니다. 돼지 저장소에서 LoaderInputFormat 클래스와 getInputFormat () 메서드를 덮어 써서 돼지의 파일을 읽을 수있었습니다. 그러나 ctrlB를 사용하여 파일을 레코드 구분 기호로 저장할 수 없습니다.

해결법

  1. ==============================

    1.Ctrl + B 구분 레코드 읽기

    Ctrl + B 구분 레코드 읽기

    SET textinputformat.record.delimiter '\n'
    x= LOAD 'xyz' USING PigStorage('\u0002');
    

    ctrl + b 구분 레코드 쓰기

    store x into 'y' using PigStorage('\u0002');
    
  2. from https://stackoverflow.com/questions/38776692/pig-store-the-file-with-custom-row-record-delimiter by cc-by-sa and MIT license