2017-08-03 5 views
0

sklearn.tree.export_graphiz()を使用する場合、エクスポートされたツリーノードのラベルには、samplesvalueなどの統計的メタデータが含まれます。統計的メタデータなしでscikit-learn DecisionTreeClassifierをレンダリングしますか?

私はこのデータなしでユーザーにツリーのバージョンを表示したいと思います。つまり、length <= 7のような判断基準と分類自体だけがノード内に表示され、それ以外は表示されません。

export_graphviz()で可能ですか?私が見ているのは、スコアimpurityを削除するためのキーワードオプションですが、他の統計情報は削除されていません。

+0

ソースを見ると、これらの他の統計情報を除外する設定パスはないようです。 DOTファイルのデータを解析し、要件に合わせてノードラベルを変更することで、DOTファイルのデータを後処理する必要があるかもしれません。 –

+0

さて、 'label'というパラメータがあります。これを' None'に設定すると、すべてのノードの不純物などの有益なラベルが隠されます。多分それが助けることができます。 –

+1

@VivekKumar:はい、ありがとう、そのパラメータが存在します。残念ながら、ツリーノードからすべての統計的メタデータを削除するわけではなく、データの*ラベル*だけを削除するので、それは私には十分ではありません。 –

答えて

0

現在、このコードにはこのようなオプションはありません。 DOTファイルの文字列を(out_file=None引数を指定して)取得し、単純なDOTパーサーで処理して、ラベルからすべてのメタデータを削除する必要がありました。

関連する問題