14
Spark 1.3.0とSpark Avro 1.0.0が使用されています。 私はthe example on the repository pageから働いています。この次のコードはうまくフィルタースパークDataFrameの文字列には、
val df = sqlContext.read.avro("src/test/resources/episodes.avro")
df.filter("doctor > 5").write.avro("/tmp/output")
しかし、私はdoctor
文字列が部分文字列を含んでいるかどうかを確認するために必要であれば、どのような作品?文字列の中に式を書いているからです。 「含む」をするために私は何をしますか?
は上記のスカラコードですか?スカラは$記号が気に入らないようです。 'import org.apache.spark.sql.functions.lit' –
スカラをインポートしました。 '$'を動作させるには 'import sqlContext.implicits._'が必要です。 'df(" foo ")'や 'org.apache.spark.sql.functions.col(" foo ")'で置き換えることもできます。 – zero323
すごい!ありがとうたくさん –