2016-06-21 2 views

答えて

1

いいえ、現在できません。並列訓練は実施されていない。しかし、バグトラッカーではそれにいくつかの作業があります。クロスバリデーションを平行して実行することもできます(つまり、複数のモデルを並行してトレーニングすることができます)。

+0

model_selectionモジュール(GridSearch)を使用して、ハイパーパラメータを並列に最適化することができます。しかし、実用的なサイズのデータ​​(実際には何もありません)では、モデルサイズが大きくなり、従業員に関連付けられたデータを持つモデルをpickling/unpicklingするとほとんどの時間がかかるため、シリアル化されます。マルチプロセッシングは本質的に直列化されます。 – Kai

+0

私はconll-2002のデータでこれを使用していますが、それはまったく大きくはありません。トレーニングのための14987文、ベースライン機能のみ。私が一番上に走ったとき、私は8つのpythonプロセスを見ました - 私は8つのCPUコアを持っています - ラウンドロビンを1つずつ実行していて、残りの7つはスリープしています...追加機能を追加したい場合は、さらに遅くなります。 – Kai

+0

Kai:プロセスの開始後に機能を抽出することができます。これは、クロスバリデーションのために行うべきことです。この場合、入力文のみが直列化される。 –

関連する問題