2017-05-18 4 views

答えて

1

まずキャッシュは、それは、df.cacheとして、その後の永続性を心配しないでください、あなたは(実際にそれをキャッシュしますdf1に第一アクション)をメモリから読み込みますdfTEMPなどval df1 = spark.sql("select * from dfTEMP)ように、今、すべての時間はあなたが照会されます、df.createOrReplaceTempView("dfTEMP")として登録しますあたかもdfがメモリに収まらないかのように、残りをディスクにこぼしてしまいます。

+0

ありがとうございました。*最初の*をキャッシングしませんでした。 – darnok

関連する問題