복붙노트

[HADOOP] InputFormat 결정

HADOOP

InputFormat 결정

나는 가장 질문을 맞는 주어진 답변하는 알아 내려고 노력하고있다 :

내 분석 :

옵션 A는 내가 존재하는 것으로 형식이지만 답변으로 적합한 경우에 나는 그것의 올바른 사용에 확실하지 않다합니다.

SequenceFiles가 적합하지 않을 것, 따라서 바이너리 데이터 (K, V) 쌍의 이진 데이터의 파일이며 이후 옵션 B에서는 가능하지 않다 ..

이 오타이며, 실제로 나는 그것이 좋은 선택이 될 것입니다 생각하는 것보다, KeyValuetextInputFormat 경우,하지만 여기에는 KeyValueFileInputFormat이 없기 때문에 옵션 C는 할 수 없습니다. 아니면 아닌가요?

거기에 더 BDBInputFormat 없습니다 그것은 오타 경우에도 그것이 경우에 맞지 것보다 실제로 BDInputFormat을하기 때문에 옵션 D 할 수 없습니다.

감사합니다! 디

해결법

  1. ==============================

    1.대답은 그것은 오타가있을 수 있습니다 옵션 C.입니다

    대답은 그것은 오타가있을 수 있습니다 옵션 C.입니다

    KeyValueTextInputFormat는 TAB으로 갈라 라인을 얻을 수 있습니다. 그래서 행 번호 열쇠가 될 것이고, 문자열 값이됩니다.

  2. ==============================

    2.그것은 어쩌면 당신은 옵션 C의 오타 추측으로, 그리고 https://hadoop.apache.org/docs/current/api/org/apache/hadoop/mapred/KeyValueTextInputFormat.html을해야합니다.

    그것은 어쩌면 당신은 옵션 C의 오타 추측으로, 그리고 https://hadoop.apache.org/docs/current/api/org/apache/hadoop/mapred/KeyValueTextInputFormat.html을해야합니다.

    자세한 내용보기 : 어떻게 하둡 - 0.20 API의 KeyValueTextInputFormat 구분을 지정하려면?

  3. from https://stackoverflow.com/questions/27930385/inputformat-decision by cc-by-sa and MIT license