0

LOGSTASHはPDFファイルを場所から読み込んで内容を引き出し、その内容を宛先(KAFKA)に送信できますか?LOGSTASHからPDFコンテンツを読む

LOGSTASHは.TXTまたは.LOGまたは.CSVファイルを読み取ることができますが、PDFからコンテンツを読み取ることができるかどうかはわかりません。

この行の提案は役に立ちます。

もしそうでなければ、kafkaにこの機能がありますか? APACHE KAFKAからPDFコンテンツを読むことは可能ですか?

答えて

1

LogstashにはPDF入力フィルタがありません。あなたは、PDFファイルの中のテキストを与えることができるプログラムを見つけることが最善の策です。 How to extract text from a PDF?

次に、PDFのテキストバージョンを生成するものをセットアップし、それらをlogstashを使用してelasticsearchにインデックスすることができます。

関連する問題