[HADOOP] 단어를 대체하는 스파크에 프로그램을 작성하는 방법
HADOOP단어를 대체하는 스파크에 프로그램을 작성하는 방법
하둡 예를 들어 .replace ()를 사용하기가 쉽다
String[] valArray = value.toString().replace("\N", "")
하지만 스파크에서 작업을 나던, 나는 다음과 같은 스파크 - 쉘에서 스칼라 쓰기
val outFile=inFile.map(x=>x.replace("\N",""))
그래서, 어떻게 대처 하는가?
해결법
-
==============================
1.어떤 이유로 당신의 x는 배열 [문자열]입니다. 당신은 어떻게 그런 거죠? 만약 당신이 좋아하면 당신은 그것을 .toString.replace 수 있지만 아마 당신이 원하는 (어쨌든 자바에서 잘못된 출력을 줄 것이다) 무엇을 얻을 수 없습니다; 당신은 아마지도의 또 다른 레이어를하고 싶은, inFile.map (X => x.map (_. ( "\ N을", "") 교체))
어떤 이유로 당신의 x는 배열 [문자열]입니다. 당신은 어떻게 그런 거죠? 만약 당신이 좋아하면 당신은 그것을 .toString.replace 수 있지만 아마 당신이 원하는 (어쨌든 자바에서 잘못된 출력을 줄 것이다) 무엇을 얻을 수 없습니다; 당신은 아마지도의 또 다른 레이어를하고 싶은, inFile.map (X => x.map (_. ( "\ N을", "") 교체))
from https://stackoverflow.com/questions/27633453/how-to-write-program-in-spark-to-replace-word by cc-by-sa and MIT license
'HADOOP' 카테고리의 다른 글
[HADOOP] 하둡 작업은 XML 파일을 분할하기 (0) | 2019.09.24 |
---|---|
[HADOOP] java.lang.ClassNotFoundException가 :에 의한 org.apache.hadoop.mapreduce.InputFormat (0) | 2019.09.24 |
[HADOOP] 코끼리 조류와 하이브 예를 주소록 protobuf 데이터를 쿼리 할 수 없습니다 (0) | 2019.09.24 |
[HADOOP] 하둡 : Sqoop을 : 데이터베이스가 존재에도 불구하고 알 수없는 데이터베이스 '샘플'오류가 발생 (0) | 2019.09.24 |
[HADOOP] 데이터 수로와 섭취와 하둡이 작동하지 않습니다 (0) | 2019.09.24 |