2017-02-21 34 views
10

私はPythonで精巧なデータを保存するためにExcelファイルを使いたいと思っています。私の問題は、既存のExcelファイルにシートを追加できないことです。ここで私はPandasを使用して既存のExcelファイルに新しいシートを保存する方法は?

import pandas as pd 
import numpy as np 

path = r"C:\Users\fedel\Desktop\excelData\PhD_data.xlsx" 

x1 = np.random.randn(100, 2) 
df1 = pd.DataFrame(x1) 

x2 = np.random.randn(100, 2) 
df2 = pd.DataFrame(x2) 

writer = pd.ExcelWriter(path, engine = 'xlsxwriter') 
df1.to_excel(writer, sheet_name = 'x1') 
df2.to_excel(writer, sheet_name = 'x2') 
writer.save() 
writer.close() 

にこのコードを、この問題に到達するためにで動作するように、サンプルコードを示唆してそれぞれ2枚の「X1」という名前のシート、および「X2」には、2つのデータフレームが保存されます。 2つの新しいDataFramesを作成し、同じコードを使用して2つの新しいシート 'x3'と 'x4'を追加しようとすると、元のデータは失われます。

import pandas as pd 
import numpy as np 

path = r"C:\Users\fedel\Desktop\excelData\PhD_data.xlsx" 

x3 = np.random.randn(100, 2) 
df3 = pd.DataFrame(x3) 

x4 = np.random.randn(100, 2) 
df4 = pd.DataFrame(x4) 

writer = pd.ExcelWriter(path, engine = 'xlsxwriter') 
df3.to_excel(writer, sheet_name = 'x3') 
df4.to_excel(writer, sheet_name = 'x4') 
writer.save() 
writer.close() 

「x1」、「x2」、「x3」、「x4」の4つのシートでExcelファイルが必要です。 「xlsxwriter」は唯一の「エンジン」ではないことがわかっています。「openpyxl」があります。私はまた、すでにこの問題について書いた他の人たちがいるのを見ましたが、それをどうやって行うのか分かりません。ここで

このlink

import pandas 
from openpyxl import load_workbook 

book = load_workbook('Masterfile.xlsx') 
writer = pandas.ExcelWriter('Masterfile.xlsx', engine='openpyxl') 
writer.book = book 
writer.sheets = dict((ws.title, ws) for ws in book.worksheets) 

data_filtered.to_excel(writer, "Main", cols=['Diff1', 'Diff2']) 

writer.save() 

から取られたコードを彼らはそれが動作することを言うが、どのように把握することは困難です。この文脈では、「ws.title」、「ws」、「dict」が何であるかはわかりません。

「x1」と「x2」を保存し、ファイルを閉じてもう一度開いて「x3」と「x4」を追加する最も良い方法はどれですか?

答えて

9

ありがとうございます。ここで

import pandas as pd 
import numpy as np 

path = r"C:\Users\fedel\Desktop\excelData\PhD_data.xlsx" 

x1 = np.random.randn(100, 2) 
df1 = pd.DataFrame(x1) 

x2 = np.random.randn(100, 2) 
df2 = pd.DataFrame(x2) 

writer = pd.ExcelWriter(path, engine = 'xlsxwriter') 
df1.to_excel(writer, sheet_name = 'x1') 
df2.to_excel(writer, sheet_name = 'x2') 
writer.save() 
writer.close() 

が、私は本当にそれが「xslxwriter」またはを介して生成されるかどうかは関係ありません。私の理解から、Excelファイルを生成します。私は誰にもいくつかの問題を持っているために完全な例が良いかもしれないと信じています"openpyxl"エンジン。

私は元のデータを失うことなく書きたい、その後

import pandas as pd 
import numpy as np 
from openpyxl import load_workbook 

path = r"C:\Users\fedel\Desktop\excelData\PhD_data.xlsx" 

book = load_workbook(path) 
writer = pd.ExcelWriter(path, engine = 'openpyxl') 
writer.book = book 

x3 = np.random.randn(100, 2) 
df3 = pd.DataFrame(x3) 

x4 = np.random.randn(100, 2) 
df4 = pd.DataFrame(x4) 

df3.to_excel(writer, sheet_name = 'x3') 
df4.to_excel(writer, sheet_name = 'x4') 
writer.save() 
writer.close() 

このコードは、仕事をします!

6

あなたが共有している例では、既存ファイルをbookにロードし、writer.bookの値をbookに設定しています。 writer.sheets = dict((ws.title, ws) for ws in book.worksheets)行では、ワークブックの各シートにwsとアクセスしています。シートのタイトルはwsですので、{sheet_titles: sheet}のキー、値のペアの辞書を作成しています。この辞書はwriter.sheetsに設定されます。 これらの手順は、基本的に既存のデータを'Masterfile.xlsx'から読み込み、ライターに読み込むだけです。

ここでは、すでにx1x2のファイルをシートとして持っているとします。サンプルコードを使用してファイルをロードしてから、とx4を追加するためにこのようなことを行うことができます。

path = r"C:\Users\fedel\Desktop\excelData\PhD_data.xlsx" 
writer = pd.ExcelWriter(path, engine='openpyxl') 
df3.to_excel(writer, 'x3', index=False) 
df4.to_excel(writer, 'x4', index=False) 
writer.save() 

これは、あなたが探していることを行うはずです。

5

openpyxl since it now supports Pandas DataFramesで直接作業することを強くお勧めします。

これにより、関連するExcelとPandasコードに集中することができます。

+0

[this](http://xlsxwriter.readthedocs.io/working_with_pandas.html)に似たもっと「パンダ」の例を追加できたら本当に助かります。 – MaxU

+0

私はパンダで多くの作業をしません私は実際に多くの例を提供することはできませんが、ドキュメントの改善を歓迎します。 –

3

一度に複数のデータを書き込むための簡単な例です。また、書き込まれたExcelファイルのシートにデータを追加する場合もあります(閉じたExcelファイル)。

初めてエクセルに書き込むとき。あなたはExcelを閉じていますが、同じ上のデータを「追加」したいファイルが、別のシートをエクセル(「1st_sheet」と「2nd_sheet」に「DF1」と「DF2」を書く)

import pandas as pd 
from openpyxl import load_workbook 

df1 = pd.DataFrame([[1],[1]], columns=['a']) 
df2 = pd.DataFrame([[2],[2]], columns=['b']) 
df3 = pd.DataFrame([[3],[3]], columns=['c']) 

excel_dir = "my/excel/dir" 

with pd.ExcelWriter(excel_dir, engine='xlsxwriter') as writer:  
    df1.to_excel(writer, '1st_sheet') 
    df2.to_excel(writer, '2nd_sheet') 
    writer.save()  

後、のは言わせて"df3"をシート名 "3rd_sheet"に追加します。

book = load_workbook(excel_dir) 
with pd.ExcelWriter(excel_dir, engine='openpyxl') as writer: 
    writer.book = book 
    writer.sheets = dict((ws.title, ws) for ws in book.worksheets)  

    ## Your dataframe to append. 
    df3.to_excel(writer, '3rd_sheet') 

    writer.save()  

Excel形式はxlsであってはならないことに注意してください。xlsx oneを使用することができます。

+1

この回答が何を追加するか分かりません。実際、このようなコンテキストマネージャを繰り返し使用すると、より多くのI/Oが必要になります。 –

+1

書き込み/クローズされたExcelファイルの新しいシートにデータを書き込む私の個人的意見です。 –

関連する問題