1
私はSVMテキスト分類のためのドキュメントベクトルを構築したいと思います。 私は自分の文書を2つの正と負の文書に索引付けしました。 そしてIGメソッドで私の特徴空間を選択しました。Luceneによって文書をベクトルに表現する。
文書をLuceneのtf-idf加重値のベクトルにする方法を教えてください。
ありがとうございます!
よろしくお願いいたします。
私はSVMテキスト分類のためのドキュメントベクトルを構築したいと思います。 私は自分の文書を2つの正と負の文書に索引付けしました。 そしてIGメソッドで私の特徴空間を選択しました。Luceneによって文書をベクトルに表現する。
文書をLuceneのtf-idf加重値のベクトルにする方法を教えてください。
ありがとうございます!
よろしくお願いいたします。
Apache Mahoutは、Javaの機械学習ライブラリです。それはcreate document vectors from lucene index(生テキストから作成された)にユーティリティを持っています。要件に応じてコードを採用することができます。