実際に文字列を個々の文字に分割するPythonセット関数はわかりませんでした。私はJaccardのpython関数を書いてpythonの交差法を使いました。私は2つのセットをこのメソッドに渡し、2つのセットをjaccard関数に渡す前に、setringでset関数を使用します。Python:Jaccard文字の交差点を使用しているが文字の交差点を使わない距離
例:文字列があるとします。NEW Fujifilm 16MP 5x Optical Zoom Point and Shoot CAMERA 2 7 screen.jpg
文字列に文字列を区切るset(NEW Fujifilm 16MP 5x Optical Zoom Point and Shoot CAMERA 2 7 screen.jpg)
を呼び出します。だから私はjaccard関数の交差点に実際にそれを送信するときには、単語の交差点の代わりに文字の交差点を見てください。どのようにして単語間の交差を行うことができますか。
#implementing jaccard
def jaccard(a, b):
c = a.intersection(b)
return float(len(c))/(len(a) + len(b) - len(c))
私は、文字列NEW Fujifilm 16MP 5x Optical Zoom Point and Shoot CAMERA 2 7 screen.jpg
にset
関数を呼び出していない場合、私は次のエラーを取得:私は言葉の交差点に単語を行い、ジャカードを取得したい文字の交差点に
c = a.intersection(b)
AttributeError: 'str' object has no attribute 'intersection'
代わりの文字を類似性。
実際には、これは完全な一致を探している交差点の間に追加機能を使用したときに私が探していたものです。 –