corpus

    0

    1答えて

    私の貧弱な文法については、事前に申し訳ありません。 GATE APIを使用してパイプラインを作成しました。これを正常に実行します。 私はこのようにserialanalysercontrollerを作成しました:pipeline =(SerialAnalyserController)Factory.createResource( "gate.creole.SerialAnalyserControll

    0

    1答えて

    言い換えの認識手法を評価するためのMSRPC(Microsoft Research Paraphrase Corpus)以外のコーパスがありますか?私はMSRPCを使用していますが、自分のアプローチを評価するために他のコーパスが必要です。

    1

    1答えて

    私は英語でクエリを取り、ロシア語で文書を検索するクロス言語情報検索に取り組んでいます。このシステムを評価するには、検索するロシア文書のコレクションを用意するのが良いでしょう。誰もが私が検索することができる文書のコレクションを知っているか、私は簡単に一緒にロシア文書(ウィキペディアを除いて)の束を掻き集めることができますか?彼らは人間の知識のいくつかの特定の領域にあった場合、それはいいだろうけれども

    3

    1答えて

    ファイルにアイテムを持たなくてもコーパスを作成する方法はありますか?たとえば、私はウェブからつかむつぶやきや段落を操作したいと思う。私は myCorpus = MyCorpus([ ('id', 'item', 'category'), ('id', 'item', 'category'), ('id', 'item', 'category'), ... ]

    4

    2答えて

    私はドイツ語の性別や複数形を伝えるためにしようとする単純なテキストマイニングアプリケーションを作成しようとしています。だから、 、すべての最初の、私はトレーニングのための大きい単語リストを必要としています。私は周りを検索しましたが、性別も複数もないリストは見つかりませんでした。

    5

    1答えて

    私はNLPを学んでいます。私は現在Word Sense Disambiguationで遊んでいます。私は訓練データとしてsemcorコーパスを使用するつもりですが、xml構造の理解には問題があります。私はグーグルで試しましたが、semcorのコンテンツ構造を説明するリソースはありませんでした。 <s snum="1"> <wf cmd="ignore" pos="DT">The</wf> <w

    1

    3答えて

    Googleが人気のある通路ブロックの機能をどのように作成したかについて、誰かが理解しているか、知っているか、包括的な文献やソースコードを指し示すことができるかどうか不思議です。しかし、あなたが同じことをすることができる他のアプリケーションについて知っていれば、あなたの答えも投稿してください。 私が何を書いているのかわからないなら、人気のある通路のhere is a link to an exam