[HADOOP] Hadoop 1.0.4에서 매퍼 / 리듀서를 연결하는 방법은 무엇입니까?
HADOOPHadoop 1.0.4에서 매퍼 / 리듀서를 연결하는 방법은 무엇입니까?
하둡 1.0.4의 "새로운"API를 사용하고있었습니다 (패키지 org.apache.hadoop.mapreduce의 클래스). 매퍼 / 리듀서를 연결하고 싶을 때 ChainMapper, ChainReducer가 "오래된"API (패키지 org.apache.hadoop.mapred의 클래스) 용으로 작성된 것을 알았습니다. 어떻게해야합니까?
해결법
-
==============================
1.나는 또한 같은 것을 찾고 있었다. 나는 답을 얻었고 늦었지만 이것을 공유하면 누군가를 도울 수 있다고 생각했습니다.
나는 또한 같은 것을 찾고 있었다. 나는 답을 얻었고 늦었지만 이것을 공유하면 누군가를 도울 수 있다고 생각했습니다.
Hadoop 2.0부터 org.apache.hadoop.mapreduce.lib.chain 패키지에서 ChainMapper 및 ChainReducer를 찾을 수 있습니다
... Job job = new Job(conf, "MyJob"); Configuration map1Conf = new Configuration(false); ... ChainMapper.addMapper(job, AMap.class, LongWritable.class, Text.class, Text.class, Text.class, true, map1Conf); Configuration map2Conf = new Configuration(false); ... ChainMapper.addMapper(job, BMap.class, Text.class, Text.class, LongWritable.class, Text.class, false, map2Conf); Configuration map3Conf = new Configuration(false); ... ChainReducer.setReducer(job, CReducer.class, Text.class, Text.class, LongWritable.class, Text.class, false, map3Conf); ... job.waitForComplettion(true); ...
-
==============================
2.이 게시물을 읽으십시오. 여기에서는 두 개의 JobConf를 사용하여 ChainMapper / ChainReducer 대신 Map Reduce Jobs를 연결하는 방법을 보여줍니다.
이 게시물을 읽으십시오. 여기에서는 두 개의 JobConf를 사용하여 ChainMapper / ChainReducer 대신 Map Reduce Jobs를 연결하는 방법을 보여줍니다.
from https://stackoverflow.com/questions/13499107/how-to-chain-mapper-reducer-in-hadoop-1-0-4 by cc-by-sa and MIT license
'HADOOP' 카테고리의 다른 글
[HADOOP] mapreduce의 감속기 출력에서 r-00000 확장을 제거하는 방법 (0) | 2019.08.11 |
---|---|
[HADOOP] HBase : 원자 적 '체크 행이 존재하지 않고 작성'조작 (0) | 2019.08.11 |
[HADOOP] hadoop의 hdfs에 JSON 데이터 저장 (0) | 2019.08.11 |
[HADOOP] Java에서 hdfs 프로토콜을 통해 hadoop에 액세스하려면 어떻게해야합니까? (0) | 2019.08.11 |
[HADOOP] Cognos BI 환경에서 Apache Hadoop 사용 (0) | 2019.08.11 |