2016-05-11 5 views
-1

csvファイル形式のサンプルデータセットをクラスタリングしようとしています。私は以下のコマンド、Kはクラスタリングを意味します

[email protected]:/usr/local/mahout/trunk$ bin/mahout kmeans -i /root/Mahout/temp/parsedtext-seqdir-sparse-kmeans/tfidf-vectors/ -c /root/Mahout/temp/parsedtext-kmeans-clusters -o /root/Mahout/reuters21578/root/Mahout/temp/parsedtext-kmeans -dm org.apache.mahout.common.distance.CosineDistanceMeasure -x 2 -k 1 -ow --clustering -cl 

を与えるときしかし、私は-cクラスタ引数をチェックするために利用できると何の入力クラスタが存在しないと言って、次のエラーを取得しています。誰もがここで>

私を助けてくださいすることができ、私は上記のコマンドのためになったエラーさ:

16/05/11 16:09:15 INFO compress.CodecPool: Got brand-new decompressor [.deflate] 
Exception in thread "main" java.lang.IllegalStateException: No input clusters found in /root/Mahout/temp/parsedtext-kmeans-clusters/part-randomSeed. Check your -c argument. 
at org.apache.mahout.clustering.kmeans.KMeansDriver.buildClusters(KMeansDriver.java:213) 
at org.apache.mahout.clustering.kmeans.KMeansDriver.run(KMeansDriver.java:147) 
at org.apache.mahout.clustering.kmeans.KMeansDriver.run(KMeansDriver.java:110) 
at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:70) 
at org.apache.mahout.clustering.kmeans.KMeansDriver.main(KMeansDriver.java:47) 
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method) 
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57) 
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43) 
at java.lang.reflect.Method.invoke(Method.java:606) 
at org.apache.hadoop.util.ProgramDriver$ProgramDescription.invoke(ProgramDriver.java:71) 
at org.apache.hadoop.util.ProgramDriver.run(ProgramDriver.java:144) 
at org.apache.hadoop.util.ProgramDriver.driver(ProgramDriver.java:152) 
at org.apache.mahout.driver.MahoutDriver.main(MahoutDriver.java:195) 
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method) 
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57) 
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43) 
at java.lang.reflect.Method.invoke(Method.java:606) 
at org.apache.hadoop.util.RunJar.run(RunJar.java:221) 
at org.apache.hadoop.util.RunJar.main(RunJar.java:136) 
+0

** Hadoop Mahout Clustering(http://stackoverflow.com/questions/37132651/hadoop-mahout-clustering) –

答えて

2

は私があなたのためにエラーメッセージをコピーしてみましょうしない:

では見つかりません入力クラスター/ root/Mahout/temp/parsedtext-kmeans-clusters/part-randomSeedを実行します。 -c引数を確認してください。

-c引数を確認または削除することを検討しましたか?

しかし、Mahoutのk-meansは本当に低品質です。別のものを使用してください。 apt-get install elkiとしてください。その代わりに、はるかに高速です。

+0

その-cフォルダにはクラスタがありません。私はまた何を与えるべきかを知らない。 –

+0

-c <入力クラスタディレクトリ>この引数で何を与えるべきかわかりません。パート乱数シードが自動的に生成されます。 –

+0

あなたは '-c'を与えなかったのですか?しかし、あなたはELKIがIMHOを使いやすくなるかもしれません。私はMahoutで良い結果を得られなかった。 –

関連する問題