20,000件を超えるデータを解析しようとしました。各レコードには4つのフィールドがあり、先頭に2つの英数字の値があります。以下は2レコードの例です。私は現在、ここのリンクに基づいてJavaを使用する膨大なソリューションを持っています:Parsing HTML Data using Java (DOM parse)。しかし、私はその解決方法を使用することを検討していません、レコードを分離するだけの過剰な作業です。 VBS、Python、または私がすでに使ったロジックに基づいてフィールドを分けることができる他の言語を使用するソリューションはありますか?または別の論理的なアプローチですか?テキストフィールドをExcelの列に解析する
100000000 SMP008483
|--- Category Western
|--- Model Ford
|--- Asset Delivered Date ?
|--- Scheduled ?
100000001 SMP008484
|--- Category Eastern
|--- Model Chevrolet
|--- Asset Delivered Date ?
|--- Scheduled ?
の予想される出力はここにある:
ID1 ID2 Category Model Asset Delivered Date Scheduled
100000000 SMP008483 Western Ford ? ?
100000001 SMP008484 Eastern Chevrolet ? ?
別のフォーマットを使用している場合は、必要な階層を提供するJSONをお勧めします。多くの言語で簡単に読むことができます。ファイルを開き、各行を繰り返し、 'text.split()'や 'test.partition()'のような文字列ルーチンを使って辞書の配列を構築することで、これを解析するPythonコードはそれほどありません。 – Kenny
このデータはどこですか?それはプレーンテキストとして表示するのとまったく同じですか? –
@TimWilliams(スペースに基づいて)元の質問のデータを更新した後、データは正確に表示されます。データはTXTファイルからのものです。 – stitch70