2016-03-23 22 views
0

3つのcsvファイルで重複が検出されるようにするにはどうすればよいですか? これまでのところ、2つのファイルに重複していることがわかりました。Python 3 csvファイルで重複を検索

import csv 

with open('tidyforms.com.csv', 'rU') as master: 
    master_indices = dict((r[0], i) for i, r in enumerate(csv.reader(master))) 

with open('jotform.com.csv', 'rU') as hosts: 
    with open('similar.csv', 'wb') as results:  
     reader = csv.reader(hosts) 
     writer = csv.writer(results) 

     writer.writerow(next(reader, [])) 

     for row in reader: 
      index = master_indices.get(row[0]) 
      if index is not None: 
       message = 'FOUND in master list (row {})'.format(index) 
       writer.writerow(row) 

答えて

1

あなたは4つのステップ

  1. オープンファイルA、マスター辞書のストア値でそれを行います。

  2. ファイルBを開いて、Bの値がすでにマスター辞書に存在するかどうかを確認します。

  3. マスター辞書にBの値を追加します。

  4. ファイルCを開いて、Cの値が既にマスターディクショナリに存在するかどうかを確認します。

あなたのコードを見てみると、あなたはすでに、手順1と終了2.

+0

を実施し、マスターディレクトリはA&Bの重複を持っていますが、必ずしもC.で重複されません – MMonkey

関連する問題