2016-05-24 5 views
0

私はいくつかの基本的なハンドソンを適用してスパークを学んでいます。Sparkのcache()関数の引数がないのはなぜですか?

以下のコードが機能します。

val fileRDD = sc.textFile("/user/cloudera/words.txt") 
val cacheRDD = fileRDD.cache() 

cache()関数はACTIONまたはTRANSFORMATIONの一部ですか?

また、cache()関数の引数を指定できますか?

また、以下のコードを試しました。

val cacheRDD = fileRDD.cache(org.apache.spark.storage.DISK_ONLY) 

が、私は、引数の上

too many arguments for method cache :()fileRDD.type 

を供給したとき、私は私がキャッシュ()関数にStorageLevelを伝える引数を指定したい場合、私は何をする必要がありますどのようなエラーの下に取得しますか?

答えて

0

私はあなたが永続性を探しています。

fileRdd.persist(StorageLevel.DISK_ONLY) 
+0

構文では、Cache()関数は引数を許可しません。 –

+0

cache()は、デフォルトのストレージレベル( 'MEMORY_ONLY')でRDDを維持します。 –

+0

Ok .. cache()は変換またはアクションですか? –

関連する問題