私はSparkアプリケーションを使用しています(Scalaを使用しています)、複数の値を含むListを持っています。私はこのリストを使用してDataFrameにwhere
句を書き、タプル上のサブセットのみを選択したいと考えています。たとえば、私のリストには 'value1'、 'value2'、および 'value3'が含まれています。SparkでDataFrameの複数の値に基づいて条件を書き込む方法
mydf.where($"col1" === "value1" || $"col1" === "value2" || $"col1" === "value3)
リストには多くの値が含まれているため、これをプログラムで実行するにはどうすればよいですか?
だけFYI $ col1は同時に3つの値をとることができないので、あなたが与えている例はNULLを返しますか? – Psidom
申し訳ありませんが私は間違いを犯しました。 &&もありません。 –