2011-01-19 4 views
3

最良のターンキー(すぐに使える、工業用強度)リレーション検出ライブラリは何ですか?最良のターンキー関係検出ライブラリですか?

私はNLTKで遊んでいて、私が得た結果はあまり満足できるものではありません。

理想的には、私はのような文章を取ることができ、ライブラリたい: "サラは子供を食べていた狼を殺した"

とそれを次のようなデータ構造に変換します。

殺された(サラ、オオカミ)

私はこれが大規模な研究の対象であり、簡単な仕事ではないことを知っています。つまり、リレーションを検出するための、すぐに使えるライブラリを知っている人はいますか?

答えて

1

更新:Extractivは利用できなくなりました。

ExtractivOn-Demand RESTサービス: http://rest.extractiv.com/extractiv/?url=https://stackoverflow.com/questions/4732686/best-turnkey-relation-detection-library&output_format=html_viewerこのページを処理します、あなたは 『GENERIC』の下の左下隅に望む2 semantic triplesを抽出して表示します。 (これはHTMLビューアのページから一部のテキストを取り除きますが、jsonやrdfの出力を利用するとこのテキストは破棄されません)。

これは商用の工業用ソリューションでは無料ですが、無料の使用は制限されています。それはウェブサービスだが、open source librariesにアクセスするために使用することができ、Language Computer Corporationから購入することができる。

+0

。それは商業的な恥です。私は何かオープンソースを探していましたが、誰かがより良いオープンソースの同等物を指摘できない限り、この回答を数日で受け入れます。 – artif

+0

Extractivはもう利用できないようです。リンクはもはや正しいページを指していません。 –

1

これらの関係は、依存関係表記の出力からかなり容易に読み取ることができます。例えば、Stanford Parser onlineに入れて、あなたが入力した依存関係であなたの例では2件名 - 動詞 - オブジェクトのトリプルの両方を見ることができるような表現を崩壊:結果は印象的で

nsubj(killed-2, Sarah-1) 
dobj(killed-2, wolf-4) 

nsubj(eating-7, wolf-4) 
dobj(eating-7, child-9) 
+0

Chrisに感謝します(お会いできて光栄です!)。以前はStanford Parserを使っていましたが、これは優れていて、依存関係の解析で近似関係の抽出がかなりうまく行われることに同意しましたが、私はもっと便利な専用ツールがあるのか​​疑問でした。 (でも、それを指摘するために+1。 – artif

関連する問題