私はこのようなXML文書持つ

pysparkのデータフレームでアクセスしてるネストした列：私はこのようなXML文書持つ

df.columns 
['Search'] 

print df.select("Search") 
DataFrame[Search: struct<Location:struct<Country:string,Latitude:bigint,Longitude:bigint,Region:string>>]

：私は1列を見ることができます

df = sqlContext.read.format('com.databricks.spark.xml').options(rowTag='Position').load('1.xml')

：

<?xml version="1.0" encoding="UTF-8" standalone="yes"?> 
<Position> 
    <Search> 
     <Location> 
      <Region>OH</Region> 
      <Country>us</Country> 
      <Longitude>-816071</Longitude> 
      <Latitude>415051</Latitude> 
     </Location> 
    </Search> 
</Position>

は、私がデータフレームの中にそれを読むを

ネストされた列にはどのようにしてアクセスしますか。 ex Location.Region？

出典

2017-02-15 runski74

は、あなたが取得するデータフレームのサンプル列を投稿することができます。 –

これは非常に有用でした。 – lakshmi

あなたは、以下のような何かを行うことができます。

df.select("Search.Location.*").show()

出力：

+-------+--------+---------+------+ 
|Country|Latitude|Longitude|Region| 
+-------+--------+---------+------+ 
|  us| 415051| -816071| OH| 
+-------+--------+---------+------+

出典

2017-02-15 05:51:20

私はこのようなXML文書持つ

答えて

関連する問題