0
私はdoc2vecモデルを訓練した後、別のモジュールの文書ベクトルを再利用したいと思います。 とのdoc-vectorsを辞書として保存すると、のように保存されます。 私はちょうどどれがメモリ効率が良いか、どれがターゲットモジュールでより高速に読み込まれるのだろうか?どの方法でdoc2vecモデルをより効率的に回復できますか?
私はdoc2vecモデルを訓練した後、別のモジュールの文書ベクトルを再利用したいと思います。 とのdoc-vectorsを辞書として保存すると、のように保存されます。 私はちょうどどれがメモリ効率が良いか、どれがターゲットモジュールでより高速に読み込まれるのだろうか?どの方法でdoc2vecモデルをより効率的に回復できますか?
パフォーマンス測定が重要です。興味深い数のデータセットについては、保存の2つの方法は同様の時間がかかるでしょう。
ベンチマーク結果を投稿してください。あなたの環境で第1および第2の方法が何秒かかったのですか? –
これは、使用しているライブラリや、公開していないコード内のその他の選択肢に依存します。 @J_Hが示唆するように、両方のアプローチを試し、タイミングを比較してください。 (また、ディスク上のサイズや見かけ上のRAM使用量など) – gojomo
ありがとう。いくつかの実験の後、私はこれらの2つの方法の間に大きな違いはないことを発見しました(少なくとも私のデータセットについては)。 – YangGuo