Hadoop : 키와 값은 출력 파일에서 탭으로 구분됩니다. 세미콜론으로 구분 된 방법은 무엇입니까?

제목이 이미 내 질문을 설명하고 있다고 생각합니다. 나는 변화시키고 싶다.

key (tab space) value

으로

key;value

모든 출력 파일에서 감속기가 매퍼의 출력에서 생성됩니다.

나는이 google에 대한 좋은 문서를 찾을 수 없었다. 아무도 이것을 달성하는 방법에 대한 코드의 일부를 줄 수 있습니까?

해결법

==============================
1.구성 속성 mapred.textoutputformat.separator를 ";"으로 설정합니다.

구성 속성 mapred.textoutputformat.separator를 ";"으로 설정합니다.

==============================

2.더 나은 문서가 없기 때문에 여기에 수집 한 내용이 있습니다.

더 나은 문서가 없기 때문에 여기에 수집 한 내용이 있습니다.

    setTextOutputFormatSeparator(final Job job, final String separator){
            final Configuration conf = job.getConfiguration(); //ensure accurate config ref

            conf.set("mapred.textoutputformat.separator", separator); //Prior to Hadoop 2 (YARN)
            conf.set("mapreduce.textoutputformat.separator", separator);  //Hadoop v2+ (YARN)
            conf.set("mapreduce.output.textoutputformat.separator", separator);
            conf.set("mapreduce.output.key.field.separator", separator);
            conf.set("mapred.textoutputformat.separatorText", separator); // ?
    }

==============================
3."KeyValueLineRecordReader"의 "KEY_VALUE_SEPERATOR"속성을 사용하여 선택한 구분 기호를 지정할 수 있습니다.

"KeyValueLineRecordReader"의 "KEY_VALUE_SEPERATOR"속성을 사용하여 선택한 구분 기호를 지정할 수 있습니다.

from https://stackoverflow.com/questions/11031785/hadoop-key-and-value-are-tab-separated-in-the-output-file-how-to-do-it-semicol by cc-by-sa and MIT license

'HADOOP' 카테고리의 다른 글

[HADOOP] Mysql에서 Pig로 테이블 데이터를 읽는 방법 (0)	2019.06.03
[HADOOP] 테이블을 조인하는 중 하이브 쿼리의 오류 (0)	2019.06.03
[HADOOP] Hadoop gzip 압축 파일 (0)	2019.06.03
[HADOOP] 하이브의 문자를 대체하는 방법? (0)	2019.06.03
[HADOOP] hadoop namenode 형식이 정확히 무엇입니까? (0)	2019.06.03

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

복붙노트

[HADOOP] Hadoop : 키와 값은 출력 파일에서 탭으로 구분됩니다. 세미콜론으로 구분 된 방법은 무엇입니까?

Hadoop : 키와 값은 출력 파일에서 탭으로 구분됩니다. 세미콜론으로 구분 된 방법은 무엇입니까?

해결법

1.구성 속성 mapred.textoutputformat.separator를 ";"으로 설정합니다.

2.더 나은 문서가 없기 때문에 여기에 수집 한 내용이 있습니다.

3."KeyValueLineRecordReader"의 "KEY_VALUE_SEPERATOR"속성을 사용하여 선택한 구분 기호를 지정할 수 있습니다.

'HADOOP' 카테고리의 다른 글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역