ファイルのフォルダ内のファイル名から番号シーケンスを特定して分離し、オプションで非連続シーケンスを特定する必要があります。ファイルは.dpxファイルです。ファイル名のどこかにシーケンス番号があり、拡張子が '.dpx'であることを除いて、ファイル命名構造はほとんどありません。 PySeqと呼ばれるすばらしいモジュールがあります。PySeqは何千ものディレクトリ、時には何十万ものファイルのディレクトリを爆撃する以外は、すべての難しい作業を行うことができます。 msgstr "引数リストが大きすぎます" msgid。誰もシーケンス番号分離と特にdpxファイルでの作業経験がありましたか?各ファイルのサイズは最大100MBです。私はPython2.7を使ってCentOSボックスに取り組んでいます。ファイル名のようなものかもしれません:
test00_take1_00001.dpx
test00_take1_00002.dpx
another_take_ver1-0001_3.dpx
another_take_ver1-0002_3.dpx
(連続する二つの系列)ファイル名シーケンス抽出python
答えて
これは、あなたがしている正確に何をすべき探している。これは、文字列の開始と終了を含むdictsのdictを作成し、リストに完全な文字列を入れます。
それは、あなたのコードがそれである何
from collections import defaultdict
input_list = [
"test00_take1_00001.dpx",
"test00_take1_00002.dpx",
"another_take_ver1-0001_3.dpx",
"another_take_ver1-0002_3.dpx"]
results_dict = defaultdict(lambda: defaultdict(list))
matches = (re.match(r"(.*?[\W_])\d+([\W_].*)", item) for item in input_list)
for match in matches:
results_dict[match.group(1)][match.group(2)].append(match.group(0))
results_list = [d2 for d1 in results_dict.values() for d2 in d1.values()]
>>> results_list
[['another_take_ver1-0001_3.dpx', 'another_take_ver1-0002_3.dpx'], ['test00_take
1_00001.dpx', 'test00_take1_00002.dpx']]
ありがとうBharel !!これは素晴らしいです。私は発電機について何も知らないので、これは大きなインセンティブです。 :)ありがとうございました。 – tinker242
こんにちは@ tinker242あなたの質問が解決した場合は、チェックマークをクリックして[受諾する](http://meta.stackexchange.com/q/5234/179419)を検討してください。これは、あなたが解決策を見つけ出し、回答者とあなた自身の両方に評判を与えていることを広範なコミュニティに示します。これを行う義務はありません。 – Bharel
申し訳ありません。私はここでもまだ少し新しいです。あなたの答えは絶対に私の問題を解決しました。 :) – tinker242
- 1. RTPシーケンス抽出
- 2. ファイル名を抽出する
- 3. ファイル名/文字列のシーケンスの検出
- 4. pythonでディレクトリを変更し、scrap spiderで.htmlファイル名を抽出
- 5. Pythonシーケンス命名規則
- 6. phingでphpファイル名を抽出する
- 7. パスからのファイル名の抽出MYSQL
- 8. PHP正規表現の抽出ファイル名
- 9. Pythonで.numbersファイルからデータを抽出
- 10. 抽出名前
- 11. 抽出スクリプト名URL
- 12. KMLから座標を抽出するBatchGeoファイルをPythonで抽出
- 13. ファイル名のみを抽出FileItemの名前から
- 14. PowerShellのm3uファイルからファイル名を抽出するスクリプト
- 15. Pythonのmp4メタデータ抽出
- 16. Pythonの:シーケンス
- 17. Javaバイトコードの任意のシーケンスを抽出して実行する
- 18. powershell - ファイル名と拡張子を抽出します。
- 19. リンクからURLページのファイル名を抽出します。
- 20. ファイル名を抽出する正規表現
- 21. の日付に基づいて抽出ファイル名は、[シェル]
- 22. matlabからファイル名の数字を抽出するには?
- 23. シェル内のファイル名の一部を抽出する
- 24. PHP UNCパスからファイル名のみを抽出します
- 25. Rubyでコマンドライン引数からファイル名を抽出する
- 26. C#のUriからファイル名を抽出する方法は?
- 27. ファイル名から映画タイトルを抽出する方法
- 28. csvファイルからカラム名を抽出するR
- 29. bashスクリプトでgit whatchangedからファイル名を抽出する
- 30. 重複したエントリ名を持つtarファイルからの抽出
(あなたにもこの部分にスキップして、メモリに関する効率化のためのリストの発電機にそれを回すかもしれない)1つのリストにリストのすべてに参加しますエラーが発生しますか? –