pandas.DataFrame.apply ValueError：オペランドをシェイプとともにブロードキャストできませんでした

ループを使用して行ごとにこの関数を実行すると機能します。 pandas.DataFrame.applyを使用して同じ関数を実行するとValueErrorが返されます：オペランドをシェイプと共にブロードキャストできませんでした。 pandas.DataFrame.applyは動作しますか？それが簡単に説明できないものの1つであれば、処理速度を上げる方法（マルチプロセッシング以外の方法）はありますか？pandas.DataFrame.apply ValueError：オペランドをシェイプとともにブロードキャストできませんでした

#python 3.6 
import pandas as pd # version 0.19.2 
import numpy as np # 
#gensim version 1.0.1 
from gensim import models #https://radimrehurek.com/gensim/models/word2vec.html 

df=pd.DataFrame({"q1":[['how', 'I', 'from', 'iPhone', 'keep', 'them', 'my', 'but', 'delete', 'iCloud', 'photos', 'in', 'can'], 
        ['use', 'are', 'radio', 'What', 'commercial', 'cognitive', 'technology', 'in'], 
        ['how', 'I', 'razor', 'prevent', 'burns', 'the', 'stomach', 'on', 'can']], 
      "q2":[['Can', 'remove', 'from', 'I', 'iPhone', 'removing', 'them', 'my', 'storage', 'photos', 'iCloud', 'without'], 
        ['radio', 'from', 'Where', 'do', 'come', 'cognitive', 'distinction'], 
        ['how', 'I', 'razor', 'prevent', 'can', 'burn']]}) 

#using pretrained model https://code.google.com/archive/p/word2vec/ 
w2v = models.KeyedVectors.load_word2vec_format('GoogleNews-vectors-negative300.bin', binary=True) 

#This works 
df['w2v_sim']=np.nan 
for i in range(len(df)):  
df['w2v_sim'].ix[i]=w2v.n_similarity(df['q1'].ix[i],df['q2'].ix[i]) 
print(str(df['w2v_sim'].ix[i])) 

#this doesn't work 
df['w2v_sim']=np.nan 
df['w2v_sim']=df.apply(w2v.n_similarity(df['q1'],df['q2']),axis=1)

とValueError：オペランド形状と一緒に放送することができませんでした（13,300）（8,300）

これはpretrainedモデルを考慮し再現することは困難であるあなたに

出典

2017-04-13 Robert Treichler

ありがとう1.5ギガバイトですが、私はそれがだと思いますあなたのアプリケーションのために、 - axis = 1で呼び出されたときに - 関数を行ごとにデータフレームに適用することによって動作します。だから1つの引数（行、シリーズ）を取る必要があります。試してみてください：

df['w2v_sim']=df.apply(lambda x: w2v.n_similarity(x.q1, x.q2), axis=1)

出典

2017-04-13 18:40:18 nbraun

エラーはありませんでした。どうもありがとうございます。 –

pandas.DataFrame.apply ValueError：オペランドをシェイプとともにブロードキャストできませんでした

答えて

関連する問題