복붙노트

[HADOOP] hadoop2에 nutch2.3.1 실행

HADOOP

hadoop2에 nutch2.3.1 실행

나는 hadoop2에 데이터를 크롤링 nutch2.3.1를 실행하려면. 나는 hadoop2 3 개 노드가 :

나는 crawler1하고 다음 명령을 실행 nutch2.3.1을 배치 : / usr / 지방 / nutch / 배포 / 빈 / 크롤링 HDFS : //xxx.xxx.xxx.xxx/urls/seed.txt 시험 (5)

그것은 작동하고 데이터를 크롤링 할 수 있지만, 크롤링 작업은 crawler1에서 실행되는 것 같습니다, 다른 노드는 nutch를 위해 어떤 일을하지 않았다.

내 질문은 :

죄송 불쌍한 내 영어, 난 정말 당신이 제공 할 수있는 모든 도움을 주셔서 감사합니다.

해결법

    from https://stackoverflow.com/questions/39485798/run-nutch2-3-1-on-hadoop2 by cc-by-sa and MIT license