[HADOOP] Hadoop에서 Snappy를 컨테이너 형식으로 사용하는 방법

2019. 7. 29. 06:45

cnpnote

HADOOP

Hadoop에서 Snappy를 컨테이너 형식으로 사용하는 방법

맵을 압축하려면 맵을 사용하고 map-reduce o / p도 사용해야합니다. 또한, 분할 가능해야합니다.

내가 온라인으로 공부할 때 Snappy가 splittable o / p를 작성하도록하려면 컨테이너와 같은 형식으로 사용해야합니다.

그것에 대해 어떻게 생각하는지 제안 해 주시겠습니까? 온라인에서 몇 가지 예를 찾아 보았지만 좋지는 않았습니다. Hadoop v0.20.203을 사용하고 있습니다.

감사. Piyush

해결법

==============================
1.산출을 위해

산출을 위해

conf.setOutputFormat (SequenceFileOutputFormat.class); SequenceFileOutputFormat.setOutputCompressionType (conf, CompressionType.BLOCK); SequenceFileOutputFormat.setCompressOutput (conf, true); conf.set ( "mapred.output.compression.codec", "org.apache.hadoop.io.compress.SnappyCodec");

지도 출력용

구성 conf = 새 구성 (); conf.setBoolean ( "mapred.compress.map.output", true); conf.set ( "mapred.map.output.compression.codec", "org.apache.hadoop.io.compress.SnappyCodec");
==============================
2.Job 용으로 새 API OutputFormat을 설치하고 구성 용으로 설치하지 않습니다. 그런 다음 첫 번째 부분은 다음과 같습니다.

Job 용으로 새 API OutputFormat을 설치하고 구성 용으로 설치하지 않습니다. 그런 다음 첫 번째 부분은 다음과 같습니다.
```
Job job = new Job(conf);
...
SequenceFileOutputFormat.setOutputCompressionType(job, CompressionType.BLOCK);
SequenceFileOutputFormat.setCompressOutput(job, true);

conf.set("mapred.output.compression.codec","org.apache.hadoop.io.compress.SnappyCodec");
```

from https://stackoverflow.com/questions/10182591/how-to-use-snappy-in-hadoop-in-container-format by cc-by-sa and MIT license

'HADOOP' 카테고리의 다른 글

[HADOOP] Hadoop과 돼지 관계 설정하기 (0)	2019.07.29
[HADOOP] 원사 : 전체 클러스터 리소스를 활용하는 방법? (0)	2019.07.29
[HADOOP] 모든 쿼리의 하이브 오류 : 작업 핸들과 관련된 로그를 찾을 수 없습니다. (0)	2019.07.29
[HADOOP] hadoop 설치를 찾을 수 없습니다 : $ HADOOP_HOME이 설정되어 있거나 hadoop이 경로에 있어야합니다. (0)	2019.07.29
[HADOOP] 새 Hadoop API를 사용하여 MultipleTextOutputFormat을 사용하려면 어떻게해야합니까? (0)	2019.07.29

,

티스토리툴바