私は、都市と郵便番号のリストが長い米国政府データを使用しています。 いくつかの作業の後、データは次の形式です。データフレームから特定の行を削除する
dat1 = data.frame(keyword=c("Bremen", "Brent", "Centreville, AL", "Chelsea, AL", "Bailytown, Alabama", "Calera, Alabama",
"54023", "54024"), tag=c(rep("AlabamCity",2), rep("AlabamaCityST",2), rep("AlabamaCityState",2), rep("AlabamaZipCode",2)))
dat1
ただし、正しく動作しないキーワードがあります。下の例では、 に「AlabamaCity」と「AlabamaCityState」というラベルの付いた2つの「郵便番号」があります。何らかの理由で、政府からの元のデータセットには、他の郵便番号と適切にグループ化されていないいくつかの郵便番号 があります。 「AlabamaZipCode」タグを持っていない私は、キーワードのリスト全体を反復処理し、数値ですべての行を削除できるか知りたいと思った
dat2 = data.frame(keyword=c("Bremen", "Brent", "50143", "Chelsea, AL", "Bailytown, Alabama", "52348",
"54023", "54024"), tag=c(rep("AlabamCity",2), rep("AlabamaCityST",2), rep("AlabamaCityState",2), rep("AlabamaZipCode",2)))
dat2
(彼らはacctually文字 値として保存されています) 。だから、以前のデータは似たようになるはずです。
dat3 = data.frame(keyword=c("Bremen", "Brent", "Chelsea, AL", "Bailytown, Alabama", "54023", "54024"),
tag=c(rep("AlabamCity",2), rep("AlabamaCityST",1), rep("AlabamaCityState",1), rep("AlabamaZipCode",2)))
dat3
私が保持したい数値と削除したい数値があるようです。 誰でも手伝ってください。