재정 TableMapper 분할

나는 시대가 초 단위로 날짜 시간의 긴 표현 미터는 미터의 번호입니다 "epoch_meter"의 포맷을 가진 해당 행 키가있는 테이블에서 읽을 다음 코드를 사용하고 있습니다.

Job jobCalcDFT = Job.getInstance(confCalcIndDeviation);

jobCalcDFT.setJarByClass(CalculateIndividualDeviation.class);

Scan scan = new Scan(Bytes.toBytes(String.valueOf(startSeconds) + "_"),
Bytes.toBytes(String.valueOf(endSeconds + 1) + "_"));

scan.setCaching(500);

scan.setCacheBlocks(false);

scan.addColumn(Bytes.toBytes("readings"), Bytes.toBytes("halfhourly"));

TableMapReduceUtil.initTableMapperJob("meterreadings", 
scan, EmitDFTMapper.class,
MeterIdFrequencyKey.class, 
ComplexWritable.class, jobCalcDFT);

해결법

==============================
1.당신은 당신의 자신의 TableMapReduceUtil를 사용해야합니다 (또는 HBase와의 복사) 및 지역 당 1 (기본 동작)보다 더 많은 분할을 반환 getSplits를 서브 클래스 TableInputFormatBase을 사용하고 무시 - 여기 TableInputFormatBase에 대한 코드를 찾을 수 있습니다

당신은 당신의 자신의 TableMapReduceUtil를 사용해야합니다 (또는 HBase와의 복사) 및 지역 당 1 (기본 동작)보다 더 많은 분할을 반환 getSplits를 서브 클래스 TableInputFormatBase을 사용하고 무시 - 여기 TableInputFormatBase에 대한 코드를 찾을 수 있습니다

그런데 depracated 된 TableInputFormat는 org.apache.hadoop.hbase.mapred 네임 스페이스가 아닌 org.apache.hadoop.hbase.mapreduce 네임 스페이스에

from https://stackoverflow.com/questions/17945990/overriding-tablemapper-splits by cc-by-sa and MIT license

'HADOOP' 카테고리의 다른 글

[HADOOP] 피닉스는 작업이 HBase를 작동하지 가입 (0)	2019.09.26
[HADOOP] 하둡 : 사용자 정의 InputFormat와 NullPointerException이 (0)	2019.09.26
[HADOOP] 하둡은 joda 종속성을 찾을 수 없습니다 (0)	2019.09.26
[HADOOP] 하둡 M / R 차 종류는 사용자의 마지막 이름에 기지를 작동하지 (0)	2019.09.26
[HADOOP] 다른 노드 클러스터 하둡 맵 작업을 예약하는 방법 (0)	2019.09.26

복붙노트

[HADOOP] 재정 TableMapper 분할

재정 TableMapper 분할

해결법

'HADOOP' 카테고리의 다른 글

티스토리툴바