2017-04-05 5 views
0

私は8000イメージのタグを含む8000テキストファイルをクラスタ化するためにrapidminerでk-meansを使用できますか?それが可能ならば、適切なKとmaxのランを選択する必要がありますか?私はrapidminerでk-meansを使用できますか?

答えて

0

はい、RapidMinerにk-Means演算子があります。カーネルとX平均を持つk-Meansのような追加のバリエーションもあります。 テキストファイルを処理するには、RapidMinerマーケットプレイスで入手可能なテキスト処理拡張機能を使用します。

最高のパラメータ設定はもちろんデータにも依存しますが、さまざまな設定を試してみてください。 1つの方法は、k-平均演算子を「最適化パラメータ」内に置くことであり、性能はクラスター性能演算子の1つまたは自己定義の性能測定値によって評価することができる。

+0

助けてくれてありがとう...私は英語の単語だけを残し、他の言語の単語を削除するために、任意の演算子を使用できますか? – faris

+0

私は今までこれをやっていません。語幹をステミングした後に似ているかもしれないので、扱いにくいかもしれません。 RapidMinerマーケットプレイスから[Aylien Text Analysis Extension](https://marketplace.rapidminer.com/UpdateServer/faces/product_details.xhtml?productId=rmx_com.aylien.textapi.rapidminer)を試すことができます。これには言語検出機能があります - – David

関連する問題