nltk

    0

    1答えて

    NLTK KMeans Clusterを使用していくつかのベクトルをクラスタリングしようとしています。私はそれらをクラスタ化しようとしたとき、私はいくつかの10次元のベクトルを持って、NLTKは時々このようなエラーを与える: Traceback (most recent call last): File "/home/yhz82415/workspace/Grouping/src/Dri

    1

    1答えて

    すべての開発ツールをインストールしたLionのコピーがあります。 Python(2.7)とRuby(1.8)はうまく動作しています。私は、Pythonのための自然言語ツールキットをインストールして、それを試してみたPythonインタプリタであり、それは import nltk >>true だから、作品を作品ました。私もRubyPython gemをインストールしましたが、動作するようですが

    1

    1答えて

    PythonライブラリNLTKを使用して単語の同義語を取得しようとしています。 私の問題:いくつかの単語を使用するとエラーが発生します。例えば、 'eat'は "WordNetError"のWordNetErrorをスローします。どういう意味ですか?単語の同義語を取得するにはどうすればよいですか? がここに犬のような言葉が仕事をどのように注意してください、私のコードです: from nltk.co

    0

    2答えて

    NLTKで使用したいテキストを含む何百ものファイルがあります。各行はがないが新しい文を含んでいます বে,বচা ইয়াণ্ঠা,র্চা ঢার্বিত তোখাটহ নতুন, অ প্রবঃাশিত। তবে ' এ বং মুশায়েরা ' পত্রিব্যায় প্রকাশিত তিনটি লেখাই বইযে সংব্যজান ব্যরার জনা বিশেষভাবে

    46

    3答えて

    訓練されたクラシファイアをどのように保存するか少し混乱します。同様に、使用するたびにクラシファイアを再トレーニングするのは明らかに実際には悪くて遅いですが、必要なときにどのように保存して再度ロードするのですか?コードは以下のとおりです。お手伝いをいただきありがとうございます。私はNLTK Naive Bayes ClassifierでPythonを使用しています。 classifier = nlt

    2

    1答えて

    単語のリスト(トークン化された文字列)を各部分文字列に分割しようとしています。私は次に、最も一般的な部分文字列を見つけるために、各部分文字列でFreqDistを実行したいと思います。最初の部分は正常に動作します。しかし、私はFreqDistを実行すると、私はエラーを取得: TypeError: unhashable type: 'list' ここに私のコードです: import nltk

    0

    1答えて

    私はMAXENT分類子に基づいて文章チャンカ、NLTKブックに記載されているように(例7.9)を実装しようとしています: http://nltk.googlecode.com/svn/trunk/doc/book/ch07.html#code-classifier-chunker 私はとチャンカを評価しよう chunker = ConsecutiveNPChunker(train_sents)

    4

    4答えて

    「haaaaapppppyyy」を「haappyy」に変換する最善の方法は何ですか? 基本的には、スラングを解析するときに、強調を加えるために文字を繰り返すことがあります。 これを実行する最善の方法は何ですか? set()を使用すると、文字の順序が明らかに重要であるため、機能しません。 アイデア?私はPython + nltkを使用しています。

    3

    2答えて

    私は、PHPを介してPOSタグ付け用のpythonスクリプトを実行しようとしています。 しかし、それは完全な出力を返さない。 Pythonスクリプト: import nltk import sys text = sys.argv[1] tokenize_into_words = nltk.word_tokenize(text) print text result = nltk.p

    1

    1答えて

    word_list = "love does not make the world go round. love is what makes the ride worthwhile" from nltk.corpus import stopwords for word in word_list: #print word if word in stopwords.words(