2017-12-14 6 views
-1

すべてのコアでローカルに動作するOpenNLPを使用してUIMAスタックを作成しました。 CSVファイルからの読み込み、データベースへのテキストの挿入、テキストの解析、POSタグ付けテキスト、テキストのチャンクなど、さまざまなタスクを実行します。また、スパーククラスタ全体でさまざまなタスクを実行するようにしました。イーマー、クリア、デュプレア4j一緒にフィッティング?

マシンラーニングアルゴリズムをスタックに追加したいと思っています.DeleLearning4jは非常に実行可能なオプションです。残念ながら、私たちが現在持っているものの中にDL4Jを統合する方法や、私が現在持っているスタックを単純に複製する方法は明確ではありませんでした。

私がUIMA、ClearTK、Deeplearning4jのサイトで見つけられなかったのは、これらの3つのライブラリがどのように適合しているかです。 DeepLearning4Jは、OpenNLP関数を呼び出す抽象クラスのClearTKセットを実装していますか? ClearTKはどんな利点を提供しますか? DeepLearning4JがClearTKフレームワークで何を実装しているか心配していますか?

ありがとうございます!

答えて

0

OpenNLPベースのAnalysisEnginesを使用するUIMAパイプラインを実行していることが分かっている限り、これまでは問題ありません。 あなたの質問からはっきりしないことは、ツーリングではなく、機能の面で探していることです。 これは、まずそれが明確になることだと思います。

それ以外は、Apache UIMAはアーキテクチャフレームワークです。 OpenNLP、DL4J、ClearTKなどを統合することができます。それ以外のものは、あなたの非構造化情報処理タスクに役立ちます。

Apache OpenNLPプロジェクトでは、さまざまなDLフレームワークの統合のためにいくつかの実験を行っていますが、https://issues.apache.org/jira/browse/OPENNLP-1009(現在のプロトタイプはDL4Jに基づいています)を使用できます。

あなたはApache Sparkクラスタを利用していると述べたので、DL4Jはスムーズに統合する必要があるため、適しています。

+0

右!ありがとう!わたしたちが把握しようとしている問題は、どういうことかと思います。たとえば、スタックをOpenNLPチェーンで使用しています。 ClearTKがどのようにフレームワーク内に収まるか、それをどのように拡張するかはわかりません。明示的に呼び出すか設定する必要がありますか? また、OpenNLPが低レベルの処理を完了したら、DL4Jメソッド(例:word2vec)を呼び出しますか? –

+0

ClearTKはラッパーフレームワークです –

0

私たちは、dl4jを使用するNLPのインターフェイスセットの一部としてのみ使用します。私たちのsentiteriterインターフェイスでトークン化と文のセグメンテーションのために内部的にUIMAを使用するトークナイザファクトリとトークナイザ。これはdeeplearning4j自体で独自のモデルを構築することとはまったく異なります。

+0

DL4JはUIMAフレームワークとは全く別のプロジェクトですが、一般的なNLPタスクを抽象化する際に組み込むことは可能でしょうか? –

+0

ええ、間違いなく!主に外部のトークナイザ/センテンスセグメンタとして使用します。 –