2016-09-09 9 views
-2

pysparkでRDDのタプルの個々の要素にアクセスできますか? PIGでは$ 0、$ 1などを使用しています...同様に、pySparkにも同様のことがあります。 タプルに10個の要素がある場合、5番目と7番目の要素を取得する方法は?どの機能を使うべきか必要な要素だけを取り出す方法。RDDでタプルの個々の要素にアクセスする

+0

の可能性のある重複[pysparkでRDDのタプルでどのようにアクセス個々の要素?](http://stackoverflow.com/questions/36629953/how-access-individual-element-in-a-tuple -on-a-rdd-in-pyspark) – JGreenwell

+0

こんにちは@JGreenwell、私はこれをポストする前に、それはいくつかのことを確認した。 –

+2

この質問とhttp://stackoverflow.com/questions/39394826/how-to-get-specific-values-from-rdd-in-spark-with-pysparkとhttp://stackoverflow.com/の違いは何ですか?/39392237/apache-sparkを追加する方法あなたは同じ質問を3回尋ねるのではなく、いくつかのPythonで作業してチュートリアルを始めることができますか? – eliasah

答えて

1

これは必要なものですか?

rdd57 = rdd.map(lambda x: (x[5], x[7])) 
+0

ありがとうございました - これは私が必要とするものでした –

関連する問題