2017-08-16 3 views
0

私はリンクから抽出した文字列について以前に投稿しました。任意の文字列入力ではトークン化されません

a="Any Random text at all , nothing freaking works" 
sentences = nltk.sent_tokenize(a) 

が、私は一貫してもらう:私のコマンドラインは非常に簡単です :だから簡単な例を試してみました、私はstr.(a)a.splita=a[0]を試してみました

TypeError: Can't convert 'list' object to str implicitly 

、および確認:

>>> type(a) 
<class 'str'> 

私のPythonに何か問題がありますか?私は例を確認しており、これは明らかに機能しているはずです。誰かが実行して、彼らは結果を取得し、もしそうなら、何が私のPython

Added image of error

+1

あるべきnltk/data.pyの69行を表示します。あなたのコードはあなたがここに投稿したのとまったく同じものですか? –

+0

@WiktorStribiżewはい!何が悪いのか分かりません。 –

+0

再生できません。 –

答えて

1

それはNLTKパッケージ自体に問題だと間違っているかもしれないかどうかを確認することができれば、それを感謝本当にだろう。画像のように、それは渡されたパラメータではなく、['']nltk/data.pyにあり、リストとみなされ、文字列に変換されます。

nltkパッケージを再インストールすると役立ちますか?無問題 -

はそれだけではPython 3.5.1で試してみました path = []

+0

ありがとう、私は再インストールではなく、すべてのパスを再定義し、必要なファイルパスを次のように手作業でコピー&ペーストすることで修正できました:nltk.data.path = ['H:\\/nltk_data' 'C:\\ nltk_data'、 'D:\\ nltk_data'、 'E:\\ nltk_data'、 'C​​:\\ Program Files \\ Python35 \\ nltk_data'、 'C​​:\\ Program Files \\ Python35 \ C:/ Program Files/Python35/tokenizers/punkt/lib/nltk_data '、' C:\ Program Files \\ Python35 \\タグガー\\ averaged_perception_tagger '、' C:\\ Program Files \\ Python35 ' PY3 ']これは単純にnltk.data.path = "C:/ Program Files/Python35"を使用して回避することを望んでいましたが、動作しません。 –

+0

Windowsでは、このhttps://gist.github.com/alvations/0ed8641d7d2e1941b9f9を参照してください。 – alvas

関連する問題