Spark가있는 Hadoop의 HDFS

저는 클러스터 컴퓨팅을 처음 접했고 Spark에서 최소 2 노드 클러스터를 설정하려고합니다. 내가 아직도 혼란스러워하는 부분은 무엇입니까? 먼저 Hadoop 전체 설치를 설정해야합니까? 아니면 Spark에서 포함 된 Hadoop 버전을 함께 제공합니까?

내가 스파크에 관해서 발견 한 것들은이 사실을 분명히 밝혀 내지 못합니다. 필자는 Spark이 Hadoop을 대체하기보다는 확장 된 것으로 이해하고 있지만 독립적으로 실행되는 Hadoop 시스템이 필요하다면 나에게 명확하지 않습니다.

HDFS가 필요합니다. 따라서 Hadoop의 파일 시스템 부분을 사용하기에 충분합니까?

누군가 나에게이 사실을 분명히 지적 할 수 있습니까?

해결법

[HADOOP] 마스터 'yarn'으로 실행하는 경우 HADOOP_CONF_DIR 또는 YARN_CONF_DIR을 환경에 설정해야합니다. (0)	2019.06.28
[HADOOP] Avro와 MR을 사용하지 않고 Java API를 사용하여 HDFS에 쪽모작 형식 작성 (0)	2019.06.28
[HADOOP] org.apache.hadoop.mapreduce.counters.LimitExceededException : 너무 많은 카운터 : 121 max = 120 (0)	2019.06.28
[HADOOP] Hive FAILED : ParseException 라인 2 : 0이 'macaddress'근처의 입력을 인식하지 못합니다 ''CHAR ''( '열 지정에서 (0)	2019.06.28
[HADOOP] hadoop 사용자 파일 권한 (0)	2019.06.28