私は法律、解説、裁判所書類など、数十万の法律文書(主に欧州連合のもの)のコーパスを持っています。私はアルゴリズム的にそれらを理解しようとしています。法的テキストのNLP?
私は既知の関係(時間的、この変更 - など)をモデル化しました。しかし、単一文書レベルでは、私は速い理解を可能にするより良いツールがあればいいと思う。私はアイデアを公開していますが、より具体的な質問があります:
たとえば、定型文とは対照的に、関連性のある/議論の余地のある部分を特定するNLPメソッドはありますか?最近流出したTTIPの論文は数千ページにもおよぶデータテーブルがありますが、そこにある文章は業界を破壊する可能性があります。
私はGoogleの新しいParsey McParface
と他のNLPソリューションを使って遊んでいましたが、彼らは印象的にうまく動作していますが、意味を分離することがどれほど良いか分かりません。