私は医学テキスト用の半自動注釈ツールを開発しています。注釈のためにRDFトリプレットを見つけるのは完全に迷っています。半自動注釈ツール - RDFトリプレットを見つける方法
現在、NLPベースのアプローチを使用しようとしています。私はすでにStanford NERとOpenNLPを調べましたが、どちらも病名抽出モデルはありません。
私の質問は *病名を抽出するための新しいNERモデルを作成するにはどうすればよいですか? OpenNLPまたはStandford NERsの助けを得ることができますか? *テキストからRDFトリプレットを抽出するには、NLP以外の方法がありますか?
助けていただけたら幸いです!ありがとう。
mmmmmmm。ok私は既にOpenNLPトレーニングツールを調べましたが、私の質問は です。本来、人の名前のために設計された病気の名前を発見するためにモデルを訓練することはできますか? –
あなたはそれが良いものとして試してみることができます。どんなツールを使うにしても、それを訓練するためのデータセットが必要になるでしょう(地名辞典/辞書によるアプローチを使わない限り)。したがって、同じデータセットを使用して異なるシステムを訓練し、それらを比較することができます。 OpenNLPトレーニングAPIは、実験を行うのに費用がかからないほど簡単です。しかし、トレーニングデータセットが必要です。 – castagna
はい。私はトレーニング/テストデータセットを少し見てきましたが、私はPubMedデータベースのように思われる無料のものをいくつか見つけました。他のトレーニングデータセットについて知っていますか? ありがとうございました! –