nltk

0熱

1答えて

NLTK KMeansクラスタリングを使用しているときにAssertionErrorが発生する

NLTK KMeans Clusterを使用していくつかのベクトルをクラスタリングしようとしています。私はそれらをクラスタ化しようとしたとき、私はいくつかの10次元のベクトルを持って、NLTKは時々このようなエラーを与える： Traceback (most recent call last): File "/home/yhz82415/workspace/Grouping/src/Dri

1熱

1答えて

RubyPythonはOS X Lionでnltkをインポートできません

すべての開発ツールをインストールしたLionのコピーがあります。 Python（2.7）とRuby（1.8）はうまく動作しています。私は、Pythonのための自然言語ツールキットをインストールして、それを試してみたPythonインタプリタであり、それは import nltk >>true だから、作品を作品ました。私もRubyPython gemをインストールしましたが、動作するようですが

1熱

1答えて

特定の単語の同義語を検索すると、WordNetErrorが作成されます。

PythonライブラリNLTKを使用して単語の同義語を取得しようとしています。私の問題：いくつかの単語を使用するとエラーが発生します。例えば、 'eat'は "WordNetError"のWordNetErrorをスローします。どういう意味ですか？単語の同義語を取得するにはどうすればよいですか？がここに犬のような言葉が仕事をどのように注意してください、私のコードです： from nltk.co

0熱

2答えて

データからコーパスをカスタム形式で作成する

NLTKで使用したいテキストを含む何百ものファイルがあります。各行はがないが新しい文を含んでいます বে,বচা ইয়াণ্ঠা,র্চা ঢার্বিত তোখাটহ নতুন, অ প্রবঃাশিত। তবে ' এ বং মুশায়েরা ' পত্রিব্যায় প্রকাশিত তিনটি লেখাই বইযে সংব্যজান ব্যরার জনা বিশেষভাবে

46熱

3答えて

Naive Bayesの訓練されたクラシファイアをNLTKに保存

訓練されたクラシファイアをどのように保存するか少し混乱します。同様に、使用するたびにクラシファイアを再トレーニングするのは明らかに実際には悪くて遅いですが、必要なときにどのように保存して再度ロードするのですか？コードは以下のとおりです。お手伝いをいただきありがとうございます。私はNLTK Naive Bayes ClassifierでPythonを使用しています。 classifier = nlt

2熱

1答えて

Python頻度分布（FreqDist/NLTK）問題

単語のリスト（トークン化された文字列）を各部分文字列に分割しようとしています。私は次に、最も一般的な部分文字列を見つけるために、各部分文字列でFreqDistを実行したいと思います。最初の部分は正常に動作します。しかし、私はFreqDistを実行すると、私はエラーを取得： TypeError: unhashable type: 'list' ここに私のコードです： import nltk

0熱

1答えて

NLTKチャンクエラー

私はMAXENT分類子に基づいて文章チャンカ、NLTKブックに記載されているように（例7.9）を実装しようとしています： http://nltk.googlecode.com/svn/trunk/doc/book/ch07.html#code-classifier-chunker 私はとチャンカを評価しよう chunker = ConsecutiveNPChunker(train_sents)

4熱

4答えて

単語から繰り返し文字を削除する

「haaaaapppppyyy」を「haappyy」に変換する最善の方法は何ですか？基本的には、スラングを解析するときに、強調を加えるために文字を繰り返すことがあります。これを実行する最善の方法は何ですか？ set()を使用すると、文字の順序が明らかに重要であるため、機能しません。アイデア？私はPython + nltkを使用しています。

3熱

2答えて

php exec missing output

私は、PHPを介してPOSタグ付け用のpythonスクリプトを実行しようとしています。しかし、それは完全な出力を返さない。 Pythonスクリプト： import nltk import sys text = sys.argv[1] tokenize_into_words = nltk.word_tokenize(text) print text result = nltk.p

1熱

1答えて

NLTKエラーが私のWORD_LISTで...私は持っている...例えば、いくつかの単語

word_list = "love does not make the world go round. love is what makes the ride worthwhile" from nltk.corpus import stopwords for word in word_list: #print word if word in stopwords.words(