HDFS에서 Unpickle 파일

저는 현재 파이썬 3을 사용하고 있는데 HDFS에서 피클 파일을로드하고 싶습니다.

from pywebhdfs.webhdfs import PyWebHdfsClient
import pickle

hdfs = PyWebHdfsClient(host='...', user_name='...')
pickled_model = hdfs.read_file(pickle_path)
model = pickle.load(pickled_model)

TypeError: file must have 'read' and 'readline' attributes

나는 피클 로딩 단계에서 유형 오류가 발생합니다. 나는 pydoop를 사용하여 파일을 열고 다음을 unpickle 할 수있는 옵션을 발견했다. 그러나 불행하게도, 파이썬 2.7을 사용할 수 없습니다. 유사한 옵션?

해결법

==============================
1.당 BluBb는 pickle.load는 파이썬의 FileHandler를 필요로한다. hdfs.read_file이 경우 바이트를 반환하고 사용 pickle.loads 제대로 모델을 참조하십시오.

당 BluBb는 pickle.load는 파이썬의 FileHandler를 필요로한다. hdfs.read_file이 경우 바이트를 반환하고 사용 pickle.loads 제대로 모델을 참조하십시오.

from https://stackoverflow.com/questions/47766722/unpickle-file-from-hdfs by cc-by-sa and MIT license

'HADOOP' 카테고리의 다른 글

[HADOOP] 하이브 테이블의 컬럼과 같은 파일 이름의 일부 (0)	2019.09.18
[HADOOP] 하둡 예를 실행할 때, 나는 ".staging / job_1541144755485_0002 / job.splitmetainfo 존재하지 않는다"는, 내가 무엇을 할 수 발생? (0)	2019.09.18
[HADOOP] CSV에서로드 Sqoop을 함께 표를 하이브 파일? (0)	2019.09.18
[HADOOP] 전제 스파크 자바 프로그램에 독립을 사용하여 GCS 파일 읽기 (0)	2019.09.18
[HADOOP] 클라우 데라 하이브 : 어디 JSON-serde-1.3.7 jar 파일을 추가합니다 (0)	2019.09.18

복붙노트

[HADOOP] HDFS에서 Unpickle 파일

HDFS에서 Unpickle 파일

해결법

1.당 BluBb는 pickle.load는 파이썬의 FileHandler를 필요로한다. hdfs.read_file이 경우 바이트를 반환하고 사용 pickle.loads 제대로 모델을 참조하십시오.

'HADOOP' 카테고리의 다른 글

티스토리툴바