2011-09-07 12 views
7

私は選択されたデータセットを持つプロジェクトに取り組んでいます。それぞれのデータは異なる属性を持っています。選択したシナリオに最も適したデータを選択するには、フィットネス機能を使用する必要があります。フィットネス機能の使い方

しかし、自分のフィットネス機能をどのように開始するかを説明するサイトは実際に見つかりません。私が持っているのは、それが遺伝的アルゴリズムの一部であり、これは私が得た限りです。だから私はここにいくつかのポインタを与えることができますか?

答えて

2

実際に必要なのはフィットネス機能ですか?

フィットネス関数は、あなたが言ったように、遺伝的アルゴリズムで使用されるものです。これは、現在の人口の問題に対する提案されたすべてのソリューションの品質を評価するために、アルゴリズムの各反復で使用されます。適合度関数は、集団内の単一の解がどれほど良好であるかを評価する。関数のx値が遺伝的アルゴリズムのy最小値であることを見出そうとしている場合、ユニットの適合関数は単に負のy値(適合度関数が高い値が小さいほど)である可能性があります。

私が基本的に言っていることは、フィットネス機能はそれほど多くの属性を処理せず、結果を評価することだけです。

属性を含むデータの最も代表的なサンプルを選択する場合は、分類またはクラスタリングの方法も検討する必要がありますか?あなたは選択されたシナリオがどのように表現されるかについて多くの情報を提供しませんでしたが、データをクラスター化することができます(k-平均クラスター化アルゴリズムを試し、分類エラーが大幅に低下するまでクラスターの数を増やしてみてください)。シナリオ要件を満たしてから代表的なデータクラスタを選択するよりも、

データ表現に関してクエリがどのように表現されているかについて詳しく説明していると、誰かから別の(またはより良い)回答が得られた可能性があります。

また、遺伝的アルゴリズムやAI /機械学習の分野の他の部分を学ぶことだけを目的としている場合は、phsが提案した内容を正確に行い、書籍、オーディオ講義を探して、または同様のもの。

12

これはGAの難しい部分です(実際、データ表現)。実際には経験によってしか学ぶことができません。

明白なことを述べると、関数は結果がどれほど良いかを測定するものでなければなりません。特に、広範囲のデータにわたってスムーズでなければならず、データがどのようなものであっても、フィットネス機能が改善する正しい方法を示す必要があります。

たとえば、答えが正しい場合を除いてゼロであるフィットネス関数は、開始時に正しい答えに近づくのに役立たないため、うまくありません。

あなたの人口が特定のポイントまで改善され、つづいてしまいますので、状況が良くなるにつれて増加するが、最高の解決策を特定しないフィットネス機能はあまり良くありません。

あなたは座って、データの例を書いて、次にどのような機能を使用できるか考える必要があります。あなたは悪いデータのために低い値を与え、良いデータのために高い値を与える何かを望んでいます。そして、それは2人の間でうまく調整されます。

あなたはまず考えてみてはいかがですか、それを素晴らしい数学的形式にする方法を見てみましょう。ブレーンストーミングして試し続け、繰り返して...最初の選択肢がそれほど良くないことがわかります.GAを実行すると、何が起こっているのかをより詳細に見て改善することができます。

+0

私はおそらく、フィットネス機能がどれほど良好であるかのフィットネス機能を判断できると思います。 – weltschmerz

関連する問題