1
を持続します.csvと:スパークは、私は、SQLを経由して、再びそれを照会する目的で一時ビューを永続化しようとしている一時ビュー
spark.sql("select * from xxx")
「CACHE TABLE xxx」にはコピーが保存されています。私は間違って何をしているのですか? DISK_ONLYクエリ可能なビュー/テーブル?
を持続します.csvと:スパークは、私は、SQLを経由して、再びそれを照会する目的で一時ビューを永続化しようとしている一時ビュー
spark.sql("select * from xxx")
「CACHE TABLE xxx」にはコピーが保存されています。私は間違って何をしているのですか? DISK_ONLYクエリ可能なビュー/テーブル?
まずキャッシュは、それは、df.cache
として、その後の永続性を心配しないでください、あなたは(実際にそれをキャッシュしますdf1
に第一アクション)をメモリから読み込みますdfTEMP
などval df1 = spark.sql("select * from dfTEMP)
ように、今、すべての時間はあなたが照会されます、df.createOrReplaceTempView("dfTEMP")
として登録しますあたかもdf
がメモリに収まらないかのように、残りをディスクにこぼしてしまいます。
ありがとうございました。*最初の*をキャッシングしませんでした。 – darnok