私はこれで働いていたので、それがしばらくされていますが、私は私の問題を解決する方法を見つけ出すことはできません。pythonで各パッケージは、正規表現を使ってテキストファイルから提供して何の抽出
私は、このようなhttp://fr.archive.ubuntu.com/ubuntu/dists/trusty-security/main/binary-amd64/
私は辞書がキーとして含む終わりに取得するために、正規表現を使用して、それを処理するためにあなたの助けをしたいと思い、このリンクでのPackages.gzファイルの存在のように複数の段落を持っていますパッケージとそれらが提供するパッケージのリストを評価します。
あなたが見ることができるように、いくつかのパッケージは他にはない1つ以上のパッケージを提供しません。私の最高の正規表現は以下の通りであった:「」なしの文章を、私はそれらすべてを必要とする:
((?<=Package:).*)|((?<=Provides:)(?:[, ]*[a-zA-Z0-9-+.]*))
それは「提供」の最初のパッケージに停止します。
何か助けていただければ幸いです。ありがとうございました。
入力文字列とは何ですか?予想される出力は何ですか? –
'*正規表現を使用していますか?'という明確な要件はありますか?このインスタンスでREを使用する理由を説明できますか? –
入力がリンク上のテキストファイルの存在している、私は正規表現で見たように必要な出力は(使用のfindAll)は、パッケージ名を含むタプルのリストになるだろうと、それは – Marc