[HADOOP] flume을 통해 트위터에서 데이터를 다운로드 할 수 없음
HADOOPflume을 통해 트위터에서 데이터를 다운로드 할 수 없음
bin/flume-ng agent -n TwitterAgent --conf ./conf/ -f conf/flume-twitter.conf -Dflume.root.logger=DEBUG,console
위의 명령을 실행하면 다음 오류가 발생합니다.
2016-05-06 13:33:31,357 (Twitter Stream consumer-1[Establishing connection]) [INFO - twitter4j.internal.logging.SLF4JLogger.info(SLF4JLogger.java:83)] 404:The URI requested is invalid or the resource requested, such as a user, does not exist. Unknown URL. See Twitter Streaming API documentation at http://dev.twitter.com/pages/streaming_api
flume / conf 폴더에있는 flume-twitter.conf 파일입니다.
TwitterAgent.sources= Twitter TwitterAgent.channels= MemChannel TwitterAgent.sinks=HDFS TwitterAgent.sources.Twitter.type = com.cloudera.flume.source.TwitterSource TwitterAgent.sources.Twitter.channels=MemChannel TwitterAgent.sources.Twitter.consumerKey=jtlmThaz307pCCQtlw9lvrrOq TwitterAgent.sources.Twitter.consumerSecret=oaGCt6OaUas13Ji5NTnPN6TFjdSKtsAUQdq4ZhAq0BFn9jgHPU TwitterAgent.sources.Twitter.accessToken=921523328-xxY9nrWijDSVC77iK40eRNVmRIopvLXovpoxBnDs TwitterAgent.sources.Twitter.accessTokenSecret=fbtuDENfBNxTooPD0EEgEo15Pg51cxNQa1CochI56gqSO TwitterAgent.sources.Twitter.keywords= WT20,hadoop,election,sports, cricket,Big data,IPL2016,Panamaleaks,Pollingday TwitterAgent.sinks.HDFS.channel=MemChannel TwitterAgent.sinks.HDFS.type=hdfs TwitterAgent.sinks.HDFS.hdfs.path=hdfs://HadoopMaster:9000/user/flume/tweets TwitterAgent.sinks.HDFS.hdfs.fileType=DataStream TwitterAgent.sinks.HDFS.hdfs.writeformat=Text TwitterAgent.sinks.HDFS.hdfs.batchSize=1000 TwitterAgent.sinks.HDFS.hdfs.rollSize=0 TwitterAgent.sinks.HDFS.hdfs.rollCount=10000 TwitterAgent.sinks.HDFS.hdfs.rollInterval=600 TwitterAgent.channels.MemChannel.type=memory TwitterAgent.channels.MemChannel.capacity=10000 TwitterAgent.channels.MemChannel.transactionCapacity=100*
해결법
-
==============================
1.flume-sources-1.x-SNAPSHOT.jar을이 링크에서 다운로드 한 jar 파일로 바꾸어보십시오.
flume-sources-1.x-SNAPSHOT.jar을이 링크에서 다운로드 한 jar 파일로 바꾸어보십시오.
트위터가 며칠 전에 기존 API를 파기했기 때문에. 이전 jar 파일은 작동하지 않습니다. 위의 링크에서 수정 된 jar를 다운로드 할 수 있습니다.
추신 나는이 방법으로 결과를 얻고있다.
from https://stackoverflow.com/questions/37067918/unable-to-download-data-from-twitter-through-flume by cc-by-sa and MIT license
'HADOOP' 카테고리의 다른 글
[HADOOP] ClassNotFoundException : 스파이크가있는 org.apache.spark.SparkConf (0) | 2019.08.03 |
---|---|
[HADOOP] Java 8로 Hadoop 2.4.1을 빌드 할 수 없음 (0) | 2019.08.03 |
[HADOOP] 아파치 하이브가 여러 클라이언트 쿼리를 처리하도록 허용하는 방법 (0) | 2019.08.03 |
[HADOOP] 변환 하이브를 매핑 할 문자열 (0) | 2019.08.03 |
[HADOOP] hadoop 분산 시스템 노드에서 파이썬 패키지 관련 문제 (0) | 2019.08.03 |