[HADOOP] 돼지에서 중복 연속 요소를 제거
HADOOP돼지에서 중복 연속 요소를 제거
UDF를 작성하지 않고 돼지에서 중복 인접한 요소를 제거 할 수있는 방법이 있습니까?
예 튜플 :
[1,2,3,3,3,4,1,1,2] -> [1,2,3,4,1,2]
해결법
from https://stackoverflow.com/questions/23618383/remove-duplicate-contiguous-elements-in-pig by cc-by-sa and MIT license
'HADOOP' 카테고리의 다른 글
[HADOOP] HBase를 여러 열 가족 내에서 값을 넣어하는 방법 (0) | 2019.09.24 |
---|---|
[HADOOP] Elasticsearch / 스톰 통합 방법 (0) | 2019.09.24 |
[HADOOP] 다른 맵퍼 톱니에 매퍼 패스 값 (0) | 2019.09.24 |
[HADOOP] 하둡 / 하이브에 손상된은 gzip 파일을 처리 (0) | 2019.09.24 |
[HADOOP] 하둡 MapReduce를 가진 이미지 처리 [폐쇄] (0) | 2019.09.24 |