2011-07-31 11 views
2

データマイニングを使用して、相関などのテクニックを使用して大量のデータセットで有用なパターンを見つけることができます。このためにいくつかのオープンソースツールが必要です。データマイニングに関する基本的な質問

このプルベースまたはプッシュベースですか?私は、データ・マイニング・エンジンへの入力としてデータ・セットと特定の問合せを提供し、回答を(SQLのように)提供するか、エンジンに入力として大きなデータ・セットを供給し、それ自体の検索パターン(これは決して存在しなかったし、そして/またはこれについてのクエリーを作成することもできませんでした)、したがって、特定のクエリーを実際に取り出すわけではありません。パターンを私たちにプッシュします。

ウィキペディアの記事のいくつかの素早い読解は、明確な方法で私の疑問を明確にしていません。

答えて

2

オープンソースとしてWekaをご覧ください。

プッシュプルのことについては、まあ、それは両方のビットです。しかしそれほど単純ではありません。あなたは何かを探しているに違いない。例えば。 クラスタを探している場合、最小限のガイダンスで回答を与える監督されていないアルゴリズムがあります。

実際には、解析するデータについて知っていて、理に適った規則性やパターンを見ていると、意味があります。

Wekaで遊ぶと、さまざまな可能性がわかります。

0

PythonおよびRは、データマイニング領域で大きな人気を得ているオープンソースのツールです。