pythonで2つの異なるファイルを比較したいと思います。それらは確率を持つ行を含み、各行はファイルの最後にidを持ちます。私は各idの比率を計算する必要があります。問題は、各行に異なる数の確率が含まれ、最終的に各テキストに異なる数の行が含まれることです。私は2つのファイルを1行で比較するスクリプトを作成することに成功しましたが、テキストの各行に対してどのように行うのかわかりません。これまでのスクリプトはこれまで通りです:Pythonの2つのファイルを1行ずつ比較します
#!/usr/bin/python
import math
import operator
f = open('output.txt','w')
file1= open("test.ppx1","r")
file2= open("test.prob1","r")
words = list(file1.read().split())
words2 = list(file2.read().split())
id1=words[-1]
id2=words2[-1]
words.remove(id1)
words2.remove(id2)
words[:]=[x[:12] for x in words]
words2[:]=[x[:12] for x in words2]
words=map(float,words)
words2=map(float,words2)
words=[math.log(y,10) for y in words]
words2=[math.log(y,10) for y in words2]
words=sum(words)
words2=sum(words2)
ratio= words-words2
print >>f, id1,words, words2,ratio
2つのファイルの例も表示できますか。 – NTAWolf
2.506201e-08 2.346253e-02 1.2382699e-02 3.336181e-05 1.821797e-07 1.424501e-07 utt-0000000001 2.506201e-082346253e-02 1.282699e-023336181e-05 1.821797e-07 1.424501 e-07 utt-0000000002 2.506201e-08 2.346253e-02 1.282699e-02 3.336181e-05 1.821797e-07第1ファイル用1.424501e-07 utt-0000000003 – oezlem
2.506201e-08 2.346253e-02 1.282699e- 02 3.336181e-05 1.821797e-07 1.424501e-07 2.506201e-08 1.821797e-07 1.424501e-07 utt-0000000001 2.506201e-08 2.346253e-02 1.282699e-02 3.336181e-05 1.821797e-07 1.424501 e-07 utt-0000000002 2.506201e-08 2.346253e-02 1.282699e-02 3.336181e-05 1.821797e-07 1.424501e-07 1.424501e-07 1.424501e-07 utt-0000000003 – oezlem