2011-12-21 2 views
2

手書きテキストのデータに対してクラスタリングアルゴリズムをテストしたいので、すでに抽出されたフィーチャを持つ手書きテキスト(単語など)のデータセットを検索しています私のクラスタリングアルゴリズムは、特徴を抽出しない)。誰もそれについての情報を持っていますか?すでに抽出されたフィーチャを持つ手書きデータセットの検索

ありがとうございました。

答えて

0

手書きの画像のデータセット数字http://yann.lecun.com/exdb/mnist/があります。

+0

はい、私はすでにこのデータベースで各画像の28 * 28ピクセルの値を特徴ベクトルとして使用してテストしました。しかし、私は、手書きの単語、文字、または数字のセットから抽出された特徴(記述子)をもっと持っていきたいと思っています。 – shn

0

Texmex「は、データの種類と様々なデータベースのサイズの概算 最近傍探索アルゴリズムの品質を評価するための」128D SIFTベクトル 、 を持っていますが、私は彼らのイメージがでているかわかりません。あなたは著者に尋ねることができます。

+0

データセットcorpus-texmexは、近似最近傍検索メソッドの評価のみを対象としています。 – shn

関連する問題