[HADOOP] 자바 S3에서 뭐 이따위로 압축 파일을 읽는 방법
HADOOP자바 S3에서 뭐 이따위로 압축 파일을 읽는 방법
하둡에서 현재 우리가 실행하는 맵리 듀스 작업이있는 출력은 SnappyCompression로 압축된다. 그런 다음 우리는 S3에 출력 파일을 이동하고있다. 지금은 자바를 통해 S3에서 압축 파일을 읽고 싶어.
해결법
-
==============================
1.나는 S3에서 스마트 한 압축 파일을 읽을 수있는 해답을 발견했다. 먼저 S3에서 개체의 콘텐츠를해야한다. 그리고 파일을 압축 해제.
나는 S3에서 스마트 한 압축 파일을 읽을 수있는 해답을 발견했다. 먼저 S3에서 개체의 콘텐츠를해야한다. 그리고 파일을 압축 해제.
S3Object s3object = s3Client.getObject(new GetObjectRequest(bucketName,Path)); InputStream inContent = s3object.getObjectContent(); CompressionCodec codec = (CompressionCodec) ReflectionUtils.newInstance(SnappyCodec.class, new Configuration()); InputStream inStream = codec.createInputStream(new BufferedInputStream(inContent)); InputStreamReader inRead = new InputStreamReader(inStream); BufferedReader br = new BufferedReader(inRead); String line=null; while ((line = br.readLine()) != null){ system.out.println(line); }
from https://stackoverflow.com/questions/29816067/how-to-read-snappy-compressed-file-from-s3-in-java by cc-by-sa and MIT license
'HADOOP' 카테고리의 다른 글
[HADOOP] java.lang.NoSuchMethodError 않는 한 : org.apache.hadoop.conf.Configuration.reloadExistingConfigurations (0) | 2019.10.02 |
---|---|
[HADOOP] 스파크 dataframe 쓰기를 사용하는 동안 어떻게 자동으로이 numRepartition을 계산 (0) | 2019.10.02 |
[HADOOP] 루프 사용하여 명령에 인수를 전달합니다 (0) | 2019.10.02 |
[HADOOP] 하둡에서 OOM 예외가 아이를 감소 (0) | 2019.10.02 |
[HADOOP] MRJob를 사용하여 여러 매퍼와 다중 입력 (0) | 2019.10.02 |