私は多かれ少なかれ同じ製品を表すリストを持っています。たとえば、以下のリストでは、すべてSeagateハードドライブです。商品リストを分類するアルゴリズムですか?
- シーゲイトハードドライブ500Go
- シーゲイトハードドライブ120Goラップトップ ため
- のSeagateのBarracuda 7200.12 ST3500418AS 500ギガバイト7200 RPM SATA 3.0GB/sのハードドライブ
- 新規およびシーゲイト からシニー500Goハードドライブ
- Seagate Barracuda 7200.12
- Seagate FreeAgentデスク500GB外付けハードドライブシルバー7200RPM USB2.0小売
人間にとって、ハードドライブ3と5は同じです。もう少し進んで、製品1,3,4,5が同じで、他のカテゴリに製品2と6を入れたとします。
私は分類したいと思う巨大な製品リストがあります。 誰かがそのようなことを行うための最良のアルゴリズムとは何かの考えを持っていますか?何か提案がありますか?
私はベイズ分類器しかし、私はそれが最善の選択かどうかはわかりません。どんな助けもありがとう!
ありがとうございました。あなたは少なくとも2つの成分必要
ありがとうございました!非常に面白いアプローチ! – Martin