私はいくつかのデータの管理に苦労しています。私は、それぞれの基本的なサブリストは、これは、各サブリストに倍の不確定数のため、私はすべてを取得する必要がありPythonのデータリストの読み込みとグループ化
EDITを続けて、次の
<1x>begins
<2x>value-1
<3x>value-2
<4x>value-3
some indeterminate number of other values
<1y>next observation begins
<2y>value-1
<3y>value-2
<4y>value-3
some indeterminate number of other values
のような構造を有しているリストのリストになってきたデータを持っています< 2の出現、 < 4は一緒に私はリストの新しいリストを作成していて分離し、グループ化された[[< 2倍>値-1、< 3X>値-2、< 4X>値-3]、[< 2Y > value-1、< 3y> value-2,< 4y> value-3]]
以下の行をすべて編集してください< 4x>と< 4y>(その点については、< 4anyalpha>は同じタイプのコーディングを持っています。これらは閉じられていないsgmlタグです。私は今日使っていたすべてのコーディングから指が痛いので、数字を使用しました。
私は最終的に出ているソリューションは非常にきれい
listINeed=[]
for sublist in biglist:
for line in sublist:
if '<2' in line:
var2=line
if '<3' in line:
var3=line
if '<4' in line:
var4=line
templist=[]
templist.append(var2)
templist.append(var3)
templist.append(var4)
listIneed.append(templist)
templist=[]
var4=var2=var3=''
ではありません私はこれをクリーンアップしようとする方法を見てきましたが、成功していません。これはうまくいきました。これは、これを1行の関数で処理できると思うので、これをPythonについてもっと学ぶ別の機会として見ました。
あなたの質問を編集して、あなたが望むもののより良い説明を与えることができれば助かります。あなたが今のところそれを持っているかどうかは分かりません。 –
リストのリストの場合は、なぜ「<1x> blah」表記でそれを表示していますか?リストの本当のリストとして表示してみませんか? [[1、x、blah]、[2、x、value-1]、...]あなたは本当に何を持っていますか?文字列のリスト?どうして? –
ソースファイルがどのようになったのかが分かるからです。私はソースファイルを読み込んでおり、処理するものを特定するために使用しなければならない各行の冒頭にタグがあります。各ソースファイルはサブリストです。この表記は、各行がSGMLタグで始まっているからです。 – PyNEwbie