Apache Sparkのデータセットからレコードを削除する方法はありますか?それともそれを達成するための選択肢がありますか?データセットspark javaから特定のレコードを削除するには?
0
A
答えて
2
filter
メソッドを使用して、これらのレコードを持たない新しいデータセットを作成できます。
データセットは変更できないため、変更することはできません(レコードを削除することはできません)。
0
SparkのDataFramesは、本質的に不変のデータ構造であるという意味でRDDに似ています。したがって、この種の影響がSparkの不変のRDDの原則に反するため、新しい列の作成や行の削除、DataFrame内の単一の要素へのインデックスへのアクセスなどは存在できません。
ザ・のみ、ご希望のデータフレームにそれを変換するためのフィルタ
ヴァルDF = spark.read.json(「例/ srcに/メイン/テスト/ employee.json」)のような変換関数を使用しているあなたが行うことができると思います
// SQL一時ビュー df.createOrReplaceTempView( "従業員")
ヴァルsqlDF = spark.sql( "SELECT * FROM社員とcustomer_id!= 002")
としてデータフレームを登録しますこのタラを使う電子あなたは
をCUSTOMER_ID = 002を持つレコードを削除することができますし、ファイルまたはテーブルにフィルタレコードを書き込むことができますsqlDF.createOrReplaceTempView(「従業員」)//従業員ビューを作成
sqlDF.write.format( "parquet")。save( "employee.parquet")//寄木細工ファイルを保存します
関連する問題
- 1. sparkのテキストから特定の文字を削除する
- 2. JavaのArrayListから特定のオブジェクトを削除するには?
- 3. LINQでデータセットからレコードを削除する方法
- 4. Aspose Javaのワードドキュメントから特定のページを削除するには?
- 5. Java ConcurrentHashMapから特定の項目を削除します
- 6. unixのファイルから特定の行を削除するには?
- 7. 削除した特定のCoreDataレコードを停止しますか?
- 8. NSCacheから特定のイメージを削除するには?
- 9. カラムから特定の値を削除するには?
- 10. MongoDBから特定の文書を削除するには?
- 11. vimから特定のファイルバッファを削除するには?
- 12. リレーションシップからレコードを削除
- 13. Spark Scala Dataframe:n番目のレコードを削除する
- 14. インデックスページからレコードを削除する
- 15. MySQLデータベースからレコードを削除する
- 16. データベースからレコードを削除する
- 17. DataViewからレコードを削除する
- 18. PHPの変数から特定の定義を削除する
- 19. データフレームから特定の行を削除する
- 20. Mongo-Hadoopコネクタ(Spark用)で文書(レコード)を削除する方法
- 21. Rのデータセットから#のような特殊文字やデータセットの空白セルを削除/置換する
- 22. 特定の列の各フィールドから特定のテキストを削除するSQLクエリ?
- 23. スライドをテーブルからレコードを削除するには
- 24. Spark - データセットからn個の行を抽出するには?
- 25. データセット内の特定の行を削除するにはどうすればよいですか?
- 26. 特定の時間の後にMySQLレコードを削除する方法
- 27. javaでコンソールの特定の行を削除する方法
- 28. リストから特定のデータを含むオブジェクトを削除する
- 29. bashのテキストファイルから特定の単語を削除する
- 30. firebaseのリストから特定のアイテムを削除するonClick