1つのExcelファイルにマージする必要があるExcelファイルが4つあります。 ID、頭文字、年齢、性別を含む人口統計ファイル。 ID、イニシャルテスト名、テスト日付、テスト値を含むラボファイル。 ID、頭文字、病状、開始日および終了日を含む医療履歴。 ID、頭文字、薬物名、用量、頻度、開始日および終了日を含む投薬。さまざまな行の複数のExcelファイルをパンダの1つのExcelファイルにマージ
患者は50人です。人口統計ファイルには、50人の患者の50行すべてが含まれています。残りのファイルには50人の患者がいますが、各患者は複数の検査室検査または複数の薬剤を持っているため、100行から400行の間にあります。
私はパンダをマージすると、間違った患者にエンティティの重複または割り当てがあります。課題は、ラボテストよりも多くの薬を与えられた患者がいる場合、ラボテストはその重複を空白で置き換えるようにすることです。
これは短縮表現です:私はこの結果を好むだろうPandas merge result
:あなたはこの結果を得る
import pandas as pd
lab = pd.read_excel('data/data.xlsx', sheetname='lab')
drugs = pd.read_excel('data/data.xlsx', sheetname='drugs')
merged_data = pd.merge(drugs, lab, on='ID', how='left')
merged_data.to_excel('merged_data.xls')
コードに出力し、質問に出力してください。 –
[mcve] – MYGz
@ DannyKofi-Armahを作成してください。あなたの質問はそれに応じて更新してください。コメントは質問を修正するものではなく、読めないので、誰かがあなたの質問をこのように読んで回答する意欲を失うことはありません。 – Boud