[HADOOP] 스파크 스칼라의 커스텀 레코드 리더 PST 파일 포맷
HADOOP스파크 스칼라의 커스텀 레코드 리더 PST 파일 포맷
필자는 PST 파일 작업을하고 있는데, 다른 입력 형식의 Mapreduce 프로그램 용 사용자 지정 레코드 판독기를 작성했지만 이번에는 불꽃이 생길 것입니다.
필자는 스파크에서 레코드 독자를 구현하는 데 어떠한 단서 나 문서도 얻지 못하고 있습니다. 어떤 몸이 이것에 도움이 될 수 있습니까? 스파크에서이 기능을 구현할 수 있습니까?
해결법
from https://stackoverflow.com/questions/52272887/custom-records-reader-pst-file-format-in-spark-scala by cc-by-sa and MIT license
'HADOOP' 카테고리의 다른 글
[HADOOP] 하이브의 파티션 열을 포함하여 다른 테이블에서 임시 테이블 만들기 (0) | 2019.07.01 |
---|---|
[HADOOP] AWS EMR의 유로 오류 (0) | 2019.07.01 |
[HADOOP] 돼지 기본 JsonLoader 스키마 문제 (0) | 2019.07.01 |
[HADOOP] Hadoop / Hive 수집 목록 - 반복되는 항목 없음 (0) | 2019.07.01 |
[HADOOP] 원격 시스템에서 mapreduce 작업을 제출하는 중에 예외가 발생했습니다. (0) | 2019.07.01 |