PySparkを使用してsparkデータフレームに欠損値を埋めようとしています。しかし、それを行う適切な方法はありません。私の仕事は、前の行または後の行に関していくつかの行の欠損値を埋めることです。具体的には、ある行の0.0の値を前の行の値に変更し、ゼロ以外の行では何もしません。私はsparkのWindow関数を見ましたが、max、min、meanのような単純な操作しかサポートしていませんが、これは私の場合には適していません。指定されたWindow上でユーザ定義の関数をスライドさせることができれば最適です。 誰か良いアイデアはありますか?Sparkデータフレームに欠損値を入力してください
2
A
答えて
1
Spark window APIを使用して前の行データにアクセスします。時系列データを扱う場合は、missing data imputation
のthis packageも参照してください。
+1
@wayag答えがあなたのために働く場合は、答えを受け入れる:) –
関連する問題
- 1. パンダを使用して別のデータフレームから1データフレームの欠損値を入力してください
- 2. Tableau最新の値で欠損値を入力してください
- 3. csvファイルに欠損値を指定してください
- 4. 欠損値の入力ファイルを扱う
- 5. 列自体と日付で決まる列の欠損値を入力してください
- 6. 欠損値を持つデータフレームの整列
- 7. sparkが欠落している入力ファイルを無視する方法を教えてください。
- 8. データフレームに欠損値が重複している値を削除する
- 9. 別のdata.frameからdata.frameの欠損値を埋めてください
- 10. 2行分のデータフレームを入力しないでください
- 11. リストに欠損値を挿入する
- 12. jsonfileキーを入力して値を入力してください
- 13. JavaScript:値を入力してテキストを入力してください
- 14. パラメータ値以外の値を入力してください
- 15. 入力に値を入れてくださいC#
- 16. データベースに正確なデータ値を入力してください
- 17. Codeigniterのデータベースの値をフォームに入力してください
- 18. コントローラにフォームの値を入力してください
- 19. javascriptのテキストボックスに値を入力してください
- 20. 欠損値を他のデータフレームの値で埋める方法
- 21. Pythonで欠損値を代入する
- 22. Linqクエリの値でDataTableを入力してください
- 23. 外部キーのテーブル値を入力してください
- 24. attr_accessorのキャスト値を入力してください
- 25. ObjectListView列の#comboboxの値を入力してください
- 26. 前の時点の値を入力してください - Stata
- 27. SQLピボットでNULL値を入力してください
- 28. sharepointリストアイテムのドロップダウン値を入力してください
- 29. Spark 2のデータフレームでNone値を受け入れる方法を教えてください。
- 30. 別の入力の値に基づいて入力値を変更してください。
サンプルデータ、試したコード、予想される出力を共有してください。 – mtoto
「前の行」はどのように定義しますか?どんなソート? –