2017-02-28 7 views
0

私は約20000のテキストファイルのコーパスを持っています。これらのテキストファイルを使用してタガーを訓練したいのですが、これらのテキストファイルを1つのテキストファイルにグループ化する必要がありますタグ付けの精度に影響するかどうかを知る)、またはこれらのテキストファイルをすべてpropsファイルに含めるかどうかを確認します。トレーニング複数のテキストファイルを使用するスタンフォードPOSタグャー

答えて

1

重要ではないと思います。コードはすべてのデータをロードするだけで、複数のファイルに分割すると便利です。また、ファイルごとに異なる入力形式を指定することもできますが、最終的なモデルには影響しません。

関連する問題