イベントの説明テキストがいくつかあります。 イベントの入場料を引き出したいと思います。 入場料が条件付きであることがあります。NLPでの情報抽出のためのパターン認識または名前付きエンティティ認識
私が達成したいのは、入場料とその条件(利用可能な場合)を抽出することです。入場料+その条件を示すフレーズや文章全体を検索するのは大丈夫です。
注I:テキストはドイツ語で書かれています。注意:ほとんどの場合、文章は主にイベントチラシまたは広告であるため、完全ではありません。
NLPでこの問題のカテゴリはどのようになりますか?それは名前付きエンティティ認識であり、Apache openNLPを使用して独自のモデルをトレーニングすることで解決できますか? または、私は、ユースケース(入口、$、しかし、唯一まで、[番号] am/pm、...)で通常のキーワードを使ってパターンを検出する方が簡単かもしれないと考えました。
私を明るく照らしてください。
入力例: - 「午後10時前にクラブに入室すると、入場は無料となり、その後は6ドルになります。 - "今夜は午後11時から午前5時までパーティーに参加してください。入場料は8ドルですが、女児や学生は半額です。"
ありがとうございます。あなたは、 "入り口"に関連する文章を見つける方法をもう少し詳しく説明できますか?あるいはモデルを訓練するべきですか? – user3234675