私は請求書と請求書のコレクションを持っているので、テキストに文脈はありません。 私はそれらの請求書から人名を抽出したいと思います。 私はOpenNLPを試しましたが、私にはコンテキストがないので、訓練されたモデルの品質は良くありません。 最初の質問は次のとおりです。モデルをトレーニングするには、コンテキストなしの人名のみが含まれていますか?それが可能であれば、私が新しいモデルを構築する方法について私に良い記事を教えてもらえますか(私が読んだ記事のほとんどは、新しいモデルを構築するための手順を説明していませんでした)。構造化されていないテキストからの人物の抽出
人名(姓、名)が100,000を超えるデータベース名があるので、NERシステムが私のケースで動作しない場合(コンテキストがないため)、検索する最良の方法は何ですかそれらの候補者(私は他のすべての名字を持つすべての名字を検索しますか?)
ありがとうございます。