복붙노트

[HADOOP] 돼지에서 중복 연속 요소를 제거

HADOOP

돼지에서 중복 연속 요소를 제거

UDF를 작성하지 않고 돼지에서 중복 인접한 요소를 제거 할 수있는 방법이 있습니까?

예 튜플 :

[1,2,3,3,3,4,1,1,2] -> [1,2,3,4,1,2]

해결법

    from https://stackoverflow.com/questions/23618383/remove-duplicate-contiguous-elements-in-pig by cc-by-sa and MIT license