2016-05-11 4 views
0

最初の列がトークンのリストで、追加の情報列が追加できるデータフレームを作成しようとしています。しかし、パンダはトークンのリストを1つの列として追加することはできません。 データフレームに行としてトークンリストを割り当てる

array1 = ['two', 'sample', 'statistical', 'inferences', 'includes'] 
    array2 = ['references', 'please', 'see', 'next', 'page', 'the','material', 'of', 'these'] 
    array3 = ['time', 'student', 'interest', 'and', 'lecturer', 'preference', 'other', 'topics'] 


## initialise list 
list = [] 
list.append(array1) 
list.append(array2) 
list.append(array3) 

## create dataFrame 
numberOfRows = len(list) 
df = pd.DataFrame(index=np.arange(0, numberOfRows), columns = ('data', 'diversity')) 

df.iloc[0] = list[0] 

の下にエラーメッセージが、私はより良いデータフレームを作成し、列の更新を達成することができますどのように任意の洞察力をいただければ幸いです

ValueError: cannot copy sequence with size 6 to array axis with dimension 2 

を読み込むようにコードが見えます。 ありがとう

+0

あなたは 'df = pd.DataFrame({'data':list})です。 df ['diversity'] = '?' '実際には、変数に' list'のような予約語を使わないでください! – MaxU

答えて

0

okですので、回答はかなり簡単で、繁栄のために投稿しました。 リストを行として追加するときは、列名と位置.. を含める必要がありましたので、コードは以下のようになります。

df.data[0] = array1 
関連する問題