7

DataLabをアップして、いくつかのノートブックを入手しました。 マシン上のローカルJupyterノートブックから同じデータにアクセスするさまざまな理由から、私は好きです。ローカルのJupyterノートブックからGoogle BigQueryデータにアクセスする

This questionこれまでのところ私は働くことができないいくつかのアプローチを提案しました。

具体のgcloudライブラリ:

from gcloud import bigquery 
client = bigquery.Client() 

は、最後の行をトレースしてくれスタックを与える:

ContextualVersionConflict: (protobuf 2.6.1 (/usr/local/lib/python2.7/dist-packages), Requirement.parse('protobuf!=3.0.0.b2.post1,>=3.0.0b2'), set(['gcloud'])) 

をパンダライブラリが有望と思われる:

df=pd.io.gbq.read_gbq('SELECT CCS_Category_ICD9, Gender, Admit_Month FROM [xxxxxxxx-xxxxx:xxxx_100MB_newform.xxxxxx_100MB_newform]ORDER by CCS_Category_ICD9', 
       project_id='xxxxxxxx-xxxxx') 

はまた私を与えますスタックトレース:

IOError: [Errno 2] No such file or directory: '/usr/local/lib/python2.7/dist-packages/httplib2-0.9.1.dist-info/METADATA' 

おそらく私のブラウザは現在プロジェクトに認証されていますが、パンダのアプローチで正式な問題がありますか?私は依存関係がないのですか?

任意の提案や指導感謝..

ローカルJupyterノートブック内からBigQueryのデータソースにアクセスするための最良の方法は何ですか?

答えて

7

gbq.read()のエラーに基づいて、httplib2が正しくインストールされていない可能性があります。パンダinstallation pageには、Google BigQueryサポート(httplib2の1つ)に必要ないくつかのオプションの依存関係があります。 再インストール/インストール試して修復するには:あなたはDatalab固有の方法を使用していた場合

from pandas.io import gbq 
df = gbq.read_gbq('SELECT * FROM MyDataset.MyTable', project_id='my-project-id') 
+0

ダーン、私はそれがあったと思う、ピップはintslledと私もピップアップグレード、同じ結果、 ( – dartdog

+0

--ignore-installedオプションは役に立ちますか? –

+0

!!私がテーブル名の前に持っていたプロジェクトID文字列を削除すると、 gでは、要するにSelect句のフォーマットが非常に悪いです! – dartdog

1

:GoogleのBigQueryのサポートのためのオプションの依存関係がインストールされたら

pip install httplib2 --ignore-installed 

を、次のコードは動作するはずですGCPにアクセスする場合は、代わりにhttps://github.com/googledatalab/datalabを試してみてください。 Jupyterノートブック内でDatalabと互換性のある機能が提供されます。

+0

そして簡単な 'ドッカーランド-p -p" 127.0.0.1:8081:8080 "-v $ PWD:"/content "gcr.io/cloud-datalab/datalab:local'は環境を必要とせずに設定しますビルドのために。 – nilleb

0

私は同じ問題があったが、GBQのcondaバージョンをインストールすることによってそれを解決するために管理し、私はあなたがピップ使用する場合

condaパンダをインストールし、いくつかのリンクが不足しているかもしれないが推測するので、私はすでにパイソンのアナコンダ分布をインストールしていました-gbq --channel conda-forge このコマンドは、ビジネスを行った

関連する問題