Apache Tikaを使用してコンテンツからファイルの種類を特定すると、 XMLファイルは正常ですがjsonはありません。コンテンツタイプがjsonの場合、 "application/json"ではなく "text/plain"が返されます。Apache TikaとJson
助けが必要ですか?それはで動作するようにバイトのみが与えられたときティカは、そのように報告したことを完全に驚くべきことではないですので、
public static String tiKaDetectMimeType(final File file) throws IOException {
TikaInputStream tikaIS = null;
try {
tikaIS = TikaInputStream.get(file);
final Metadata metadata = new Metadata();
return DETECTOR.detect(tikaIS, metadata).toString();
} finally {
if (tikaIS != null) {
tikaIS.close();
}
}
}
ファイルを扱っていない場合、またはファイル拡張子をヒントとして信頼できない場合は、誰でも提案がありますか? – milletron
@milletron Apache Tikaにファイルの内容を渡すと、マミックマジックベースの検出も行われます – Gagravarr
Thanks @Gagravarr。はい、私は私がプッシュスルーするダースまたは別のバイトストリームで全体的にMIME検出を動作させることができますが、まだJsonとプレーンテキストを別々に区別しません(少なくとも1.15)。私はXMLとHTMLに似た新しいDetectorを書く必要があると思いますか?私はJSONが既に含まれていないことに驚いています。 – milletron