복붙노트

[HADOOP] PDI 단계를 사용하여 HDFS에 연결할 수 없음

HADOOP

PDI 단계를 사용하여 HDFS에 연결할 수 없음

Windows 8 시스템에서 Ubuntu 14.04 VM에서 Hadoop 2.4를 성공적으로 구성했습니다. Hadoop 설치가 정상적으로 작동하고 있으며 Windows 탐색기에서 네임 노드를 볼 수 있습니다. 첨부 된 이미지 아래 :

그래서, 내 호스트 이름은 : 우분투 및 hdfs 포트 : 9000 (내가 틀렸다면 나를 수정하십시오).

Core-site.xml :

<property>
  <name>fs.defaultFS</name>
  <value>hdfs://ubuntu:9000</value>
</property>

문제는 내 Pentaho 데이터 통합 ​​도구에서 HDFS에 연결하는 동안입니다. 아래 첨부 이미지. PDI 버전 : 4.4.0 사용 단계 : Hadoop 파일 복사

PDI를 사용하여 HDFS에 연결하는 것을 도와주십시오. 이 병을 설치하거나 업데이트해야합니까 ?? 더 많은 정보가 필요하면 알려 주시기 바랍니다.

해결법

  1. ==============================

    1.PDI 4.4 afaik는 Hadoop 2.4를 지원하지 않습니다. 어쨌든 특정 Hadoop 구성을 사용하도록 설정해야하는 파일에 속성이 있습니다 (포럼 등에 "shim"이라고하는 "Hadoop 구성"이 표시 될 수 있음). 데이터 통합 ​​/ plugins / pentaho-big-data-plugin / plugin.properties 파일에는 active.hadoop.configuration이라는 속성이 있으며 기본적으로 Apache Hadoop 0.20을 참조하는 "hadoop-20"으로 설정됩니다. x 분포. Pentaho와 함께 제공되는 "최신"배포판으로 설정하거나 내 블로그 게시물에 설명 된대로 자신 만의 심을 만들길 원할 것입니다.

    PDI 4.4 afaik는 Hadoop 2.4를 지원하지 않습니다. 어쨌든 특정 Hadoop 구성을 사용하도록 설정해야하는 파일에 속성이 있습니다 (포럼 등에 "shim"이라고하는 "Hadoop 구성"이 표시 될 수 있음). 데이터 통합 ​​/ plugins / pentaho-big-data-plugin / plugin.properties 파일에는 active.hadoop.configuration이라는 속성이 있으며 기본적으로 Apache Hadoop 0.20을 참조하는 "hadoop-20"으로 설정됩니다. x 분포. Pentaho와 함께 제공되는 "최신"배포판으로 설정하거나 내 블로그 게시물에 설명 된대로 자신 만의 심을 만들길 원할 것입니다.

    http://funpdi.blogspot.com/2013/03/pentaho-data-integration-44-and-hadoop.html

    PDI의 향후 버전 (5.2+)에서는 Hadoop 2.4 이상을 포함한 공급 업체 배포판을 지원할 예정이므로 PDI 마켓 플레이스 및 pentaho.com에서주의를 기울이십시오 :)

  2. from https://stackoverflow.com/questions/25043374/unable-to-connect-to-hdfs-using-pdi-step by cc-by-sa and MIT license