복붙노트

[HADOOP] 맵리 듀스를 사용하여 암호로 보호 된 zip 파일을 처리하면 [복제]

HADOOP

맵리 듀스를 사용하여 암호로 보호 된 zip 파일을 처리하면 [복제]

나는 하둡 맵리 듀스를 사용하여 암호로 보호 된 압축 파일을 처리 할. 나는 ZipFileInputformat를 사용하여 보호되지 않은 zip 파일을 처리 할 수 ​​있었다. 그러나 암호로 보호 된 zip 파일을 지원하지 않습니다. 나는 그것의 바이트 콘텐츠를 사용할 수있는 경우 암호로 보호 된 zip 파일 또는 추출 zip 파일에 스트림 액세스를 제공하는 모든 자바 라이브러리가 있습니까? 미리 감사드립니다.

해결법

  1. ==============================

    1.당신이 암호로 보호 된 zip 파일을 읽을 수있는 자바 라이브러리를 찾을 수 있습니다 가정하면이 라이브러리를 사용하는 현재의 ZipFileInputFormat을 수정할 수 있어야한다 (예를 들어이 블로그 문서를 참조하십시오) 다음은 각각의 암호를 구성해야합니다 구성 옵션을 통해 압축 파일 (희망 당신은 너무 많은 파일이없는, 또는 모든 파일은 동일한 비밀번호를 사용하여 보호됩니다).

    당신이 암호로 보호 된 zip 파일을 읽을 수있는 자바 라이브러리를 찾을 수 있습니다 가정하면이 라이브러리를 사용하는 현재의 ZipFileInputFormat을 수정할 수 있어야한다 (예를 들어이 블로그 문서를 참조하십시오) 다음은 각각의 암호를 구성해야합니다 구성 옵션을 통해 압축 파일 (희망 당신은 너무 많은 파일이없는, 또는 모든 파일은 동일한 비밀번호를 사용하여 보호됩니다).

    그것은 충분히 쉽게해야합니다. 그것을 시도하고 당신이 문제가 발생하면 다른 질문을 게시 - 또는 입력 형식의 저자에게로 (https://github.com/cotdp/com-cotdp-hadoop는 ZipFileInputFormat의 하나의 가능한 구현 내가 구글을 통해 찾을 수있다) 에 그는 당신을 위해 업데이트를 롤백 할 수 있는지 여부

  2. from https://stackoverflow.com/questions/19738929/processing-password-protected-zip-files-using-mapreduce by cc-by-sa and MIT license