'rdd'에 해당되는 글 38건
- [SCALA] 어떻게 스파크에 dataframe에 RDD 개체를 변환하는
- [HADOOP] 스파크 RDD에서 combineByKey 및 aggregateByKey없이 지정된 출력을 얻는 방법
- [HADOOP] 직렬화 및 사용자 정의 스파크 RDD 클래스
- [HADOOP] 왜 미리 파티션 때문에 셔플을 줄이는 스파크 작업을 혜택?
- [HADOOP] foreachPartition과 같은 RDD 메서드 / 클로저 내에서 SparkContext hadoop 구성 사용
- [HADOOP] 웹 사이트에서 데이터 스트림을 읽도록 스파크 스트리밍을 시도하는 중 소켓은 무엇입니까?
- [HADOOP] Spark의 Map Task에서 거대한 메모리 소비
- [HADOOP] RDD 파티션 방법
- [HADOOP] S3 버킷에서 파일을로드 할 때 Spark에서 만드는 파티션은 몇 개입니까?
- [HADOOP] Spark RDD에서 빈 파티션을 제거하십시오.