EMR의 사용자 지정 환경 변수를 스파크 응용 프로그램에 사용할 수 있도록 설정하는 방법

스파크 애플리케이션을 실행할 때 사용할 수 있도록 EMR에 맞춤 환경 변수를 설정해야합니다.

나는 이것을 추가하려고 노력했다 :

                   ...
                   --configurations '[                                    
                                      {
                                      "Classification": "spark-env",
                                      "Configurations": [
                                        {
                                        "Classification": "export",
                                        "Configurations": [],
                                        "Properties": { "SOME-ENV-VAR": "qa1" }
                                        }
                                      ],
                                      "Properties": {}
                                      }
                                      ]'
                   ...

또한 "spark-env를 hadoop-env로 대체하려고했습니다. 하지만 아무것도 작동하는 것 같습니다.

aws 포럼에서이 대답이 있습니다. 하지만 어떻게 적용할지 알아낼 수는 없습니다. EMR 5.3.1에서 실행 중이며 cli : aws emr create-cluster ...에서 사전 구성된 단계로 실행합니다.

해결법

==============================

1.아래 JSON과 같은 사용자 지정 구성을 파일 custom_config.json에 추가합니다.

아래 JSON과 같은 사용자 지정 구성을 파일 custom_config.json에 추가합니다.

[   
  {
   "Classification": "spark-env",
   "Properties": {},
   "Configurations": [
       {
         "Classification": "export",
         "Properties": {
             "VARIABLE_NAME": VARIABLE_VALUE,
         }
       }
   ]
 }
]

emr 클러스터를 만들 때 파일 참조를 --configurations 옵션에 전달합니다.

aws emr create-cluster --configurations file://custom_config.json --other-options...

==============================
2.나를 위해 spark-env를 yarn-env 고정 문제로 대체했습니다.

나를 위해 spark-env를 yarn-env 고정 문제로 대체했습니다.

from https://stackoverflow.com/questions/42395020/how-to-set-a-custom-environment-variable-in-emr-to-be-available-for-a-spark-appl by cc-by-sa and MIT license

'HADOOP' 카테고리의 다른 글

[HADOOP] 하이브에 XML 파일을로드하는 방법 (0)	2019.06.21
[HADOOP] Hadoop에서 사용자 정의 쓰기 가능 구현? (0)	2019.06.21
[HADOOP] hadoop 단어 계산 예제를 실행할 수 없습니까? (0)	2019.06.21
[HADOOP] hdfs의 하이브 파일은 관리되지 않는 (외부가 아닌) 테이블을 삭제할 때 삭제되지 않습니다. (0)	2019.06.21
[HADOOP] 테스트 HBase 연결 (0)	2019.06.21

복붙노트

[HADOOP] EMR의 사용자 지정 환경 변수를 스파크 응용 프로그램에 사용할 수 있도록 설정하는 방법

EMR의 사용자 지정 환경 변수를 스파크 응용 프로그램에 사용할 수 있도록 설정하는 방법

해결법

1.아래 JSON과 같은 사용자 지정 구성을 파일 custom_config.json에 추가합니다.

2.나를 위해 spark-env를 yarn-env 고정 문제로 대체했습니다.

'HADOOP' 카테고리의 다른 글

티스토리툴바