nltk

    1

    2答えて

    私は私が私が希望 ['MOST', 'INTERESTED', 'IN', 'NUT', 'BUTTERS'] として出力を得る tokenizer = RegexpTokenizer(r'\w+') としての私のトークナイザを定義するとき MOST INTERESTED IN NUT BUTTERS トークナイザ正規表現で次の文をトークン化したいです出力は ['MOST', 'I

    1

    2答えて

    は、テキストのコーパスで見つかったトップn最も一般的なバイグラムの、top_n、私はタプルのリストを持っていると言う: import nltk from nltk import bigrams from nltk import FreqDist bi_grams = bigrams(text) # text is a list of strings (tokens) fdistBigra

    1

    1答えて

    このようなグラフをNLTKでプロットしたいと思います。しかし、NLTKのどこにそのような例があるのか​​分かりません。誰かがこの種の数字をプロットするためのNLTKコードの例を表示できますか?ありがとう。 http://universaldependencies.org/introduction.html

    0

    1答えて

    NLTKのsynsetsに特定の単語が存在するかどうかチェックしたいと思います。次のコードはそれを行います。 from nltk.corpus import wordnet if wordnet.synsets(word): ... do something ... しかし、確認する単語がたくさんある場合は遅くなります。より速い方法がありますか? 私は実際のsynsetオブジェクト

    1

    1答えて

    私はユーザーレビューデータセットを持っています。このデータセットを読み込んでいますが、分類基準に適合させる前にユーザーのレビューを事前処理しています(停止語、句読点の削除、小文字への変換、挨拶の削除など)。エラーが発生しています。ここに私のコードは次のとおりです。 import pandas as pd import numpy as np df=pd.read_json("C

    0

    1答えて

    私はtwitterデータベースで感情分析を行うためにコードをオンラインにしました。私はそれを実行しようとしたが、それは印刷のための最初のエラーで私に与えた。これは、新しいバージョンのpythonが印刷を行う方法を変更したことを理解した。誰かがPythonで作業していて、私が間違っている場所を見るためにワシの目を持っていると、配列にデータが埋め込まれていないことを示すエラーが発生しています。 imp

    3

    1答えて

    のmovie_reviewsのデータセットunigramモデルのトレーニングコードを以下に示します。 bigram、trigramモデルを考慮して、その性能を訓練し分析したいと思っています。どうすればそれをすることができますか? import nltk.classify.util from nltk.classify import NaiveBayesClassifier from nltk.

    -1

    1答えて

    を: from nltk.tokenize import sword_tokenize しかし、私は次のエラーを取得する: builtins.ImportError: No module named 'nltk.tokenize' この問題の解決方法を教えてください。

    0

    1答えて

    インテントは、私が以下のリンクの助けを借りて達成することができるPOSタグを基にしています。スペイシーを使用して同様の結果を達成しようとし How can I best determine the correct capitalization for a word? ? def truecase(doc): truecased_sents = [] # list of truecased

    -2

    2答えて

    NLTKライブラリをダウンロードしようとしています。 私は既にpipインストールを実行しています。私はアナコンダを使用しておりますので、条件がすでに 満足した私は import nltk nltk.download() を実行して、私はこのエラーを取得する: showing info https://raw.githubusercontent.com/nltk/nltk_data/gh-pa