[HADOOP] hadoop2에 nutch2.3.1 실행
HADOOPhadoop2에 nutch2.3.1 실행
나는 hadoop2에 데이터를 크롤링 nutch2.3.1를 실행하려면. 나는 hadoop2 3 개 노드가 :
나는 crawler1하고 다음 명령을 실행 nutch2.3.1을 배치 : / usr / 지방 / nutch / 배포 / 빈 / 크롤링 HDFS : //xxx.xxx.xxx.xxx/urls/seed.txt 시험 (5)
그것은 작동하고 데이터를 크롤링 할 수 있지만, 크롤링 작업은 crawler1에서 실행되는 것 같습니다, 다른 노드는 nutch를 위해 어떤 일을하지 않았다.
내 질문은 :
죄송 불쌍한 내 영어, 난 정말 당신이 제공 할 수있는 모든 도움을 주셔서 감사합니다.
해결법
from https://stackoverflow.com/questions/39485798/run-nutch2-3-1-on-hadoop2 by cc-by-sa and MIT license
'HADOOP' 카테고리의 다른 글
[HADOOP] 메소를 사용하는 경우 HDFS 읽고 스파크가 실패 (0) | 2019.09.21 |
---|---|
[HADOOP] 실행 하둡 내 자신의 빌드 스파크 제출 (0) | 2019.09.21 |
[HADOOP] GCP에 R 스튜디오 서버 프로와 하이브 w / B 연결 (0) | 2019.09.21 |
[HADOOP] 리눅스에서 hadoop2.2.0 설치 (네임 노드가 시작되지 않음) (0) | 2019.09.21 |
[HADOOP] 왜 미리 파티션 때문에 셔플을 줄이는 스파크 작업을 혜택? (0) | 2019.09.21 |