[HADOOP] K는 클러스터링 조련사를 의미
HADOOPK는 클러스터링 조련사를 의미
나는 csv 파일 형식으로되어 샘플 데이터 집합을 클러스터하려합니다. 하지만 아래의 명령을 줄 때,
user@ubuntu:/usr/local/mahout/trunk$ bin/mahout kmeans -i /root/Mahout/temp/parsedtext-seqdir-sparse-kmeans/tfidf-vectors/ -c /root/Mahout/temp/parsedtext-kmeans-clusters -o /root/Mahout/reuters21578/root/Mahout/temp/parsedtext-kmeans -dm org.apache.mahout.common.distance.CosineDistanceMeasure -x 2 -k 1 -ow --clustering -cl
나는 더 입력 클러스터는 사용할 수 없습니다 말과 -c 클러스터 인수를 확인하기 위해, 다음과 같은 오류를 얻고있다. 누군가가 제발 도와 드릴까요>
여기에 위의 명령받은 오류 :
16/05/11 16:09:15 INFO compress.CodecPool: Got brand-new decompressor [.deflate]
Exception in thread "main" java.lang.IllegalStateException: No input clusters found in /root/Mahout/temp/parsedtext-kmeans-clusters/part-randomSeed. Check your -c argument.
at org.apache.mahout.clustering.kmeans.KMeansDriver.buildClusters(KMeansDriver.java:213)
at org.apache.mahout.clustering.kmeans.KMeansDriver.run(KMeansDriver.java:147)
at org.apache.mahout.clustering.kmeans.KMeansDriver.run(KMeansDriver.java:110)
at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:70)
at org.apache.mahout.clustering.kmeans.KMeansDriver.main(KMeansDriver.java:47)
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
at java.lang.reflect.Method.invoke(Method.java:606)
at org.apache.hadoop.util.ProgramDriver$ProgramDescription.invoke(ProgramDriver.java:71)
at org.apache.hadoop.util.ProgramDriver.run(ProgramDriver.java:144)
at org.apache.hadoop.util.ProgramDriver.driver(ProgramDriver.java:152)
at org.apache.mahout.driver.MahoutDriver.main(MahoutDriver.java:195)
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
at java.lang.reflect.Method.invoke(Method.java:606)
at org.apache.hadoop.util.RunJar.run(RunJar.java:221)
at org.apache.hadoop.util.RunJar.main(RunJar.java:136)
해결법
-
==============================
1.내가 당신에 대한 오류 메시지를 복사 보자 :
내가 당신에 대한 오류 메시지를 복사 보자 :
당신은 확인 또는 -c 인수를 제거하는 생각 해 봤나?
그러나 코끼리 조련사 K-수단 정말 낮은 품질입니다. 다른 것을 사용합니다. elki를 설치 apt-get을 대신하는 시도, 훨씬 더 빠릅니다.
from https://stackoverflow.com/questions/37155710/k-means-clustering-mahout by cc-by-sa and MIT license
'HADOOP' 카테고리의 다른 글
[HADOOP] 구문은 데이터베이스에 100 개 테이블에서 수입 5 Sqoop을합니다 - 키워드를 제외 사용하지 않는? (0) | 2019.10.22 |
---|---|
[HADOOP] 하둡 소스 이클립스를 구성 다운로드 (0) | 2019.10.22 |
[HADOOP] 64 비트 VM 윈도우 7 32 비트에 우분투 14.04에 빅 데이터 하둡을 설치하는 방법 (0) | 2019.10.22 |
[HADOOP] 두 번 맵리 듀스를 호출 (0) | 2019.10.22 |
[HADOOP] 역사 UI가 작동하지 스파크 | Ambari | 실 (0) | 2019.10.22 |