私は巨大なsensor data
を持っており、Python
に取り組んでいます。問題はdate formats
です。基本的に、これは日付列の様子です。 恐ろしい日付データを扱うデータを扱う
07/ 7/15 06:51
07/ 7/15 06:53
07/ 7/15 06:55
07/ 7/15 06:57
07/ 7/15 06:59
2015-07-07 07:00:46.047
07/ 7/15 07:03
07/ 7/15 07:05
07/ 7/15 07:07
07/ 7/15 07:09
07/ 7/15 07:11
07/ 7/15 07:13
2015-07-07 07:15:53.007
2015-11-14 23:33:43.000
2015-11-14 23:35:44.000
2015-11-14 23:37:43.000
2015-11-14 23:39:43.000
2015-11-14 23:41:43.000
11/14/15 23:42
2015-11-14 23:45:43.000
11/14/15 23:46
2015-11-14 23:49:43.000
2015-11-14 23:51:44.000
私は平日、週末を利用するには日付を解析するつもりですし、余分として多分私は(1ではなく、通常の日付の365に番号を使用している)彼らに
Julian date format
をオンにします。私がしようとした
:私は、パーサーまでCSV
日を読んでいながら、日付を解析
。例えばdateutil.parser.parse(x)は
Datetime.strptime
pd.read_csv(......, parse_dates('date'))
と読むと、いくつかのファイルでは'object'
、他のファイルでは'datetime64'
という形式の日付列が読み込まれます。しかし、形式のファイル'datetime64'
日付のでは解析できない、それがエラーを与えた場合でも:
"Unknown String Format".
任意のアイデアは役立つだろう!
すべての日付は、句読点の文字がハイフンではなく、日、月、年を表す文字列の長さが異なる場合がありますか? –
または、日付の見かけの順序を目安として頼ることができますか? –
@BillBell – dss