2012-03-27 13 views
1

まず、この質問(Getting A File's Mime Type In Java)を見ましたが、選択された回答は単なるリンクです。JavaのMIMEタイプ検出ライブラリ

私は、JavaでファイルのMIMEタイプを判別する方法を探しています。私はWebcrawlerを実行しているため、さまざまな種類のMIME 。

私はJMimeMagicを使い、シンプルで良いと思われますが、ベータ版であり、クラッシュがあります。 Apache TikaはMIME検出を含む多くのことを行いますが、大きなものです。他のライブラリでも同じことが起こります。

MIME検出の特定のライブラリ(JMimeMagicと同様ですが動作しています)があり、多くのMIMEタイプを認識でき、ファイル拡張子だけを使用していないかどうかを知りたいと思います。そうでない場合は、Apache Tikaのような大きなライブラリが適切ですか?

答えて

1

Apache Tikaはこれまでのところ最も包括的な選択です。私はそれに行くことを提案します。

+0

私は前にTikaを知りませんでしたが、サイトで簡単に読むと、Tikaはこのケースに対して包括的でも適切でもないと思うようになります。ファイルのMIMEタイプを特定するのではなく、かなり限られたファイルタイプのセットからコンテンツを抽出するために使用されているようです。 JMimeMagicは、数百種類のタイプをサポートする「魔法」、特にJMimeMagicと比較しています。私は前にJMimeMagicを見ていましたが、それが生産システムで使用するには壊れていることに同意します。 –

+0

私は個人的にTikaを同様のユースケースに使用しており、かなり良いと判断して使用することを強くお勧めします。 – Drona

+0

Tikaは、MIMEタイプの検出に加えて、他にもたくさんのことをします。ほとんどのファイルタイプをサポートしています。これは、ApacheのLuceneプロジェクトでMIME検出とコンテンツ解析に使用されています。 – Drona

関連する問題