2016-08-21 39 views
-2

私は、02:00:30のような記録時間を含むrddの構造を持っています。 私はこのフォーマットから2番目のフォーマットにデータを変換したい、私はこのtreatementをしたい:02 * 3600 + 00 * 60 + 30 誰かがpysparkでこの治療をするのを助けてくれる?前もって感謝します。pysparkによる数学的操作

+2

はSOへようこそ。このリンクを最初にチェックしてくださいhttp://stackoverflow.com/help/how-to-ask –

答えて

0

マップそれ

rdd=rdd.map(lambda row: [3600*int(row[0].split(':')[0])+60*int(row[0].split(':')[1])+*int(row[0].split(':')[2])) 
関連する問題