ペルシア語のNLTKの機能の使い方は?ペルシア語のNLTK
例: 'concordance' 'concordance'を使うと答えは 'not match'ですが、私のテキストには一致のパラメータがあります。
入力は非常に簡単です。「helloسلام」が含まれています。「concordance」のパラメータが「hello」の場合は正解ですが、「سلام」の場合は「not matches」です。私のための出力は「1の一致の1を表示する」です。
import nltk
from urllib import urlopen
url = "file:///home/.../1.html"
raw = urlopen(url).read()
raw = nltk.clean_html(raw)
tokens = nltk.word_tokenize(raw)
tokens = tokens[:12]
text = nltk.Text(tokens)
print text.concordance('سلام')
最小限のコード例と最小限の入力例を試してみることはできますか?あなたは起こると思った? – jogojapan