文字列のある列を含むデータセットがあります。これらの列の1つに識別子が含まれています。次に、その識別子がこのパターンに従っているかどうかを確認したいと思います。 AB12CDなので、2文字(首都)、2つの数字の後ろに2文字をもう一度入力します。PythonのStringが正しいパターン(適切な書式設定)に従っているかどうかを確認しようとしています
データは、パンダのデータフレームに格納されます。私は持っています:
for i in range(0, len(data.columns)):
if data.columns[i] == 'identifier ':
pattern = re.compile("[A-Z][A-Z][0-9][0-9][A-Z][A-Z]")
if pattern.match(data.ix[i, 0]):
data['identifier Check'] = 'Ok'
else:
data['identifier Check'] = 'identifier Format incorrect'
しかし、これは動作していません。それはすべての行OKまたはCorpキーが間違っています。最初の行に応じて。
誰も私を助けることができますか? ありがとう!