Pythonを使用してデータを1行に整理するにはどうすればよいですか？

-2

データの説明： MyデータファイルExpData.txt、included hereには、複数のサブジェクトを含む実験結果が含まれています。Pythonを使用してデータを1行に整理するにはどうすればよいですか？

1）番目の列は、2列の応答時間に相当

2）4桁の被験者IDに対応しています。

目的：私は、このデータファイルを読み取り、データをフォーマットし直すことができるようにする必要 は、このようになります（各被験者のための試行の数は15から25の範囲です） 1行に1つの件名（統計的に分析しやすくするため）。つまり、各行はサブジェクトIDで始まり、そのサブジェクトの応答時間が続き、昇順にソートされ、スペースで区切られます。私はExpDataReformat.txtと呼ばれる別のデータファイルとして再フォーマットされたデータを保存する必要が

0001 80 81 . . . 120 125 
0003 77 78 . . . 109 110 112 117 120 123 
0005 78 78 . . . 120 120 
-. . .

： は次のようになります。

これを行う方法に関するアイデアはありますか？どこで始めるのか？

私はこのコードを編集しようとしましたが、他の人が州と首都を追加して並べ替えるポストで共有しました。言うまでもなく、私は構文エラーを受けていました。

infile = open('TestData/StateCapitalList.txt','r') stateData = infile.read() infile.close() dataLines = stateData.split('\n') state = [] capital = [] for line in dataLines: if line: iState, iCapital = line.split(',') state.append(iState) capital.append(iCapital) outfile = open('TestData/sCapitalList.txt','w') capital.sort() for iCap in capital: outfile.write(iCap + '\n') outfile.close()

出典

2016-10-31 Belinda

すでに何のコードを持っていますか？ – blacksite

データの開始点を確認するためにファイルをダウンロードする必要はありません。 –

の行のどれも '-'で始まらない... –

from collections import defaultdict 

result = defaultdict(list) 

with open('ExpData.txt') as infile: 
    for line in infile: 
     key, value = line.split() 
     result[key].append(int(value)) 

with open('out.txt', 'w') as outfile: 
    for key, value_list in sorted(result.items()): 
     outfile.write(' '.join([key] + map(str, sorted(value_list))) 
         + '\n')

出典

2016-10-31 23:22:11

構文エラーが発生しました... 3.5.2を使用している可能性がありますか？ – Belinda

エラーは何を言いましたか？最後に）：ファイル "C：\ Users \ jisse \ Desktop \ 5.2c.py"、12行目、 outfile.write（ '' .join（[key] + map（str、sorted（value_list））） + '\ n'） TypeError：リストに連結できるのはリスト（マップではない）だけです –

私は編集しようとしていたコードを追加しました – Belinda

質問にはコードは含まれていないため、この回答には何も含まれていません。

ファイルを開いて空の辞書を作成する必要があります。

ファイル内の各行について、subjectとdataに分割します。サブジェクトが辞書にキーとして存在するかどうかをテストします。一致しない場合は、値が単一の要素dataを含むリストであるそのキーの辞書エントリを作成します。サブジェクトがすでに辞書に存在する場合は、dataを値に追加します。

ファイルが使い尽くされると、辞書内の各キー（ソートされた順）にキー値が出力され、すべてのデータ項目をそれらの間のスペースで結合した文字列が続きます。

出典

2016-10-31 23:19:45 holdenweb

あなたはgroupbyを使用することができます。

from itertools import groupby 

with open(path) as f: 
    it=(line.split() for line in f) 
    for k, g in groupby(it, key=lambda e: e[0]): 
     print(k, sorted(map(int, (t[1] for t in g))))

プリント：

0001 [80, 81, 81, 82, 89, 90, 97, 99, 101, 108, 112, 114, 118, 120, 120, 125] 
0003 [77, 78, 84, 86, 89, 92, 99, 101, 101, 101, 103, 106, 106, 108, 109, 110, 112, 117, 120, 123] 
0005 [78, 78, 83, 86, 87, 89, 95, 104, 109, 110, 113, 114, 115, 119, 120, 120] 
0012 [80, 83, 86, 87, 89, 91, 92, 99, 100, 101, 101, 101, 104, 108, 110, 113, 113, 113, 120, 122, 124] 
0015 [78, 78, 80, 80, 81, 81, 85, 86, 89, 91, 94, 100, 100, 102, 107, 109, 115, 116, 116, 121, 122, 123, 125, 125] 
0021 [78, 79, 80, 83, 87, 88, 90, 91, 91, 96, 96, 96, 100, 102, 108, 109, 118, 125] 
0024 [76, 78, 78, 83, 87, 88, 88, 89, 92, 96, 96, 103, 107, 108, 108, 108, 111, 112, 113, 119, 119, 120, 122, 123, 125] 
0027 [78, 81, 84, 85, 90, 92, 95, 95, 96, 98, 99, 105, 105, 106, 108, 111, 113, 115, 118, 118, 120, 121, 123, 124] 
0040 [76, 78, 79, 80, 81, 82, 82, 84, 90, 93, 93, 94, 99, 103, 104, 107, 107, 109, 114, 117, 120, 125] 
0041 [75, 80, 85, 86, 87, 89, 90, 94, 94, 98, 103, 105, 106, 116, 122] 
0043 [76, 83, 84, 85, 86, 86, 91, 94, 102, 105, 107, 108, 119, 123, 123, 124, 125] 
0044 [81, 81, 83, 85, 85, 86, 86, 92, 95, 98, 98, 98, 99, 101, 102, 103, 106, 112, 115, 117, 118, 122] 
0047 [84, 86, 90, 90, 92, 94, 94, 97, 98, 100, 101, 102, 105, 109, 111, 113, 115, 116, 118, 119, 120, 121] 
0052 [75, 84, 97, 101, 103, 104, 106, 106, 110, 111, 118, 122, 123, 123, 124] 
0054 [76, 78, 79, 80, 83, 85, 95, 101, 101, 104, 105, 107, 111, 113, 115, 117, 120, 120] 
0057 [75, 75, 75, 76, 79, 80, 82, 82, 83, 84, 86, 90, 93, 94, 95, 95, 96, 99, 100, 102, 102, 112, 116, 119, 120, 124] 
0072 [77, 78, 78, 79, 83, 88, 92, 97, 100, 101, 105, 106, 115, 115, 117] 
0077 [78, 85, 86, 88, 88, 90, 98, 98, 102, 104, 105, 106, 112, 116, 121, 124] 
0080 [76, 82, 84, 85, 90, 94, 100, 101, 107, 107, 109, 110, 112, 115, 115, 118, 118, 121, 122, 125] 
0082 [75, 77, 80, 81, 81, 82, 83, 86, 89, 90, 96, 98, 103, 106, 108, 109, 111, 112, 112, 112, 113, 115, 117, 118, 120, 124]

出典

2016-10-31 23:43:29 dawg

groupbyが物事だったのを知りませんでした！groupbyはpython 3.5.2ですか？昇順でソートするにはどうすればよいですか？ – Belinda

更新を参照してください。 ... – dawg

返信ありがとうございます！私のファイルパスでコードをコピー/ペーストしましたが、 "SyntaxError :(ユニコードエラー）" unicodeescapeのコーデックで、2-3位のバイトをデコードできません：切り詰められた\ UXXXXXXXXエスケープ " – Belinda

Pythonを使用してデータを1行に整理するにはどうすればよいですか？

答えて

関連する問題