0
現在、Twitterデータストリームを格納するAvroスキーマを作成しています。 JSONで マイデータソース:カサンドラでApache Avroスキーマのリストまたはコレクション
{
'id': '123456789',
'text': 'bla bla bla...',
'entities': {
'hashtags': [{'text':'hashtag1'},{'text':'hashtag2'}]
}
}
、私は、ハッシュタグのデータを格納するコレクション(セットまたはリスト)を定義することができます。 しかし、私はApache Avroでどのようにこの構造を定義するのか分かりません。ここで
は私の最高の試みです:
{"namespace": "ln.twitter",
"type": "record",
"name": "main",
"fields": [
{"name": "id","type": "string"},
{"name": "text","type": "string"},
{"name": "hashtags","type": "string"} // is there any better format for this ?
]
}
はあなたのアドバイスをしてください必要があります。
ありがとう、 Yusata。