pyspark sql dataframe nullのみ保持する

私はSQLデータフレームdfを持っていて、カラムはuser_idです。データフレームをフィルタリングして保存するにはどうすればよいですか？user_idは、 pysparkモジュールページhereからは、簡単に行を削除できますが、その逆を行う方法は記述されていません。pyspark sql dataframe nullのみ保持する

試したdf.filter(df.user_id == 'null')ですが、結果は0列です。多分それは文字列 "null"を探しています。それは「NULL」

出典

2016-06-14 hdy

という名前の変数を探しているとしてもdf.filter(df.user_id == null)は試してみてください動作しません

df.filter(df.user_id.isNull())

出典

2016-06-14 21:16:05 David

pyspark sql dataframe nullのみ保持する

答えて

関連する問題