私がやりたいことは非常に簡単です。紙/本を含むPDF/PS/DjVuファイルがあれば、論文の著者とタイトルを見つけることができます良いが、必要性は低い)。この認識は完璧である必要はありませんが、私はできる限り良いものにしたいと思います。私は、これらのファイルのメタデータと内容にアクセスできるオープンソースの.NETおよび/またはJavaライブラリ(できれば.NET)を探しています。PDF、PostScript、および/またはDjVuを解析するためのライブラリ
私はPDFBox(.NET/Java)とPDF Library(.NET)を見つけましたが、私が気づいていないより良い選択肢があるかもしれません。 PostscriptとDjVuのために、私は何も見つけられませんでした。