복붙노트

[HADOOP] 단어를 대체하는 스파크에 프로그램을 작성하는 방법

HADOOP

단어를 대체하는 스파크에 프로그램을 작성하는 방법

하둡 예를 들어 .replace ()를 사용하기가 쉽다

String[] valArray = value.toString().replace("\N", "")

하지만 스파크에서 작업을 나던, 나는 다음과 같은 스파크 - 쉘에서 스칼라 쓰기

val outFile=inFile.map(x=>x.replace("\N",""))

그래서, 어떻게 대처 하는가?

해결법

  1. ==============================

    1.어떤 이유로 당신의 x는 배열 [문자열]입니다. 당신은 어떻게 그런 거죠? 만약 당신이 좋아하면 당신은 그것을 .toString.replace 수 있지만 아마 당신이 원하는 (어쨌든 자바에서 잘못된 출력을 줄 것이다) 무엇을 얻을 수 없습니다; 당신은 아마지도의 또 다른 레이어를하고 싶은, inFile.map (X => x.map (_. ( "\ N을", "") 교체))

    어떤 이유로 당신의 x는 배열 [문자열]입니다. 당신은 어떻게 그런 거죠? 만약 당신이 좋아하면 당신은 그것을 .toString.replace 수 있지만 아마 당신이 원하는 (어쨌든 자바에서 잘못된 출력을 줄 것이다) 무엇을 얻을 수 없습니다; 당신은 아마지도의 또 다른 레이어를하고 싶은, inFile.map (X => x.map (_. ( "\ N을", "") 교체))

  2. from https://stackoverflow.com/questions/27633453/how-to-write-program-in-spark-to-replace-word by cc-by-sa and MIT license