を作る現在、私は、ファイルから特定のURLを削除するには、次を使用しますURL)追加ルールを追加する必要があります。ファイルからURLのリストを取得し、番号のアレイ
fileA
のファイルからURLのリストを取得し、それらを配列arrayB
に配置し、indexB
のURLをユーザーに表示したいとします。
次に、削除しないURLのURLにindexB
という数字を入力します。これらの数値を高値から低値にソートして、arrayB
を調べ、最高のインデックスから始まる対応するインデックス番号を削除します。この時点で私の配列には、ページfileA
から削除する必要のあるURLだけが含まれています。
私は再びfileA
を訪れ、ページと配列にURLが見つかると、そのURLをfileA
からfileB
に削除します。
私の主な関心事は、すべて一緒に行を削除し、ページのURLが1行にあるときに、fileA
でarrayB
を比較し、arrayB
であるfileA
内のURLを削除する方法今です。
警告には、1つの行に1つの悪いURLと1つ以上の悪いURLがあり、その対処方法がわからないことがあります。
私が正しく理解していれば、fileAのURLはブラックリスト候補のリストです(fileA = newfile)? URLのリストの形式は何ですか? 1つの文字列= 1行= 1つのURL?ソースとターゲットの短い例がうまくいくでしょう。 –
お返事ありがとうございます。私のfileAは、http:.... urlがページの中に入っているhtmlソースファイルです。 1行に複数行、時には1行に2行、テキストの中に隠れる行があります。 FileAはクリーンアップする必要があります。 –