統計的メタデータなしでscikit-learn DecisionTreeClassifierをレンダリングしますか？

sklearn.tree.export_graphiz()を使用する場合、エクスポートされたツリーノードのラベルには、samplesとvalueなどの統計的メタデータが含まれます。統計的メタデータなしでscikit-learn DecisionTreeClassifierをレンダリングしますか？

私はこのデータなしでユーザーにツリーのバージョンを表示したいと思います。つまり、length <= 7のような判断基準と分類自体だけがノード内に表示され、それ以外は表示されません。

export_graphviz()で可能ですか？私が見ているのは、スコアimpurityを削除するためのキーワードオプションですが、他の統計情報は削除されていません。

2017-08-03 Dun Peal

ソースを見ると、これらの他の統計情報を除外する設定パスはないようです。 DOTファイルのデータを解析し、要件に合わせてノードラベルを変更することで、DOTファイルのデータを後処理する必要があるかもしれません。 –

さて、 'label'というパラメータがあります。これを' None'に設定すると、すべてのノードの不純物などの有益なラベルが隠されます。多分それが助けることができます。 –

@VivekKumar：はい、ありがとう、そのパラメータが存在します。残念ながら、ツリーノードからすべての統計的メタデータを削除するわけではなく、データの*ラベル*だけを削除するので、それは私には十分ではありません。 –

現在、このコードにはこのようなオプションはありません。 DOTファイルの文字列を（out_file=None引数を指定して）取得し、単純なDOTパーサーで処理して、ラベルからすべてのメタデータを削除する必要がありました。

2017-08-09 00:42:20

答えて