2017-07-30 4 views
-1

私は、次のファイルを読み込むしようとしている、およびCSVの読み込みに問題が発生しますCSVに読んでください。 CSVファイルには、データのヘッダーより前のファイルの上部に多くの情報が含まれています。私はのskipRowsを試してみました、そしてコンテンツは、ファイルの先頭にものをスキップするが、それは動作しません。は、行をスキップしようとしているが、問題を抱えて削除する最初の6行

誰かがこのファイルを読み込む方法についての提案を提供してもらえますか? CSVに

現在のプログラム

import urllib 
import pandas as pd 
import StringIO 
import datetime 
import sys 
if sys.version_info[0] < 3: 
    from StringIO import StringIO as stio 
else: 
    from io import StringIO as stio 
myfile=[] 
dls "http://www.spdrgoldshares.com/assets/dynamic/GLD/GLD_US_archive_EN.csv" 
f = urllib.urlopen(dls) 
myfile += f.readline() 
TESTDATA=stio(myfile) 
daily_prices = pd.read_csv(TESTDATA, sep=",", header=None, skiprows=13, 
names=["Date", "GLD Close", "LBMA Gold Price", "NAV per GLD in Gold", 
"NAV/share at 10.30 a.m. NYT", "Indicative Price of GLD at 4.15 p.m. NYT",\ 
"Mid point of bid/ask spread at 4.15 p.m. NYT","Premium/Discount of GLD mid 
point v Indicative Value of GLD at 4.15 p.m. NYT",\ 
"Daily Share Volume","Total Net Asset Value Ounces in the Trust as at 4.15 
p.m. NYT", "Total Net Asset Value Tonnes in the Trust as at 4.15 p.m. NYT", 
"Total Net Asset Value in the Trust"]) 

前テーブルにヘッダは以下の情報がファイルに含まれています。スキップ行とコンテンツを使用しようとしましたが、どちらも動作しませんでした。

SPDRゴールド・シェア(ニューヨーク証券取引所アルカ)、

は「『SPDR』(マグロウヒル」)の商標は、マグロウヒル・カンパニーズ・インクからのライセンスに基づき使用されていません」。提供されませ金融商品SPDR "Gold Trustまたはその関連会社は、McGraw-Hillによってスポンサー、支持、販売、または昇進されたものであることにご注意ください。本書のいかなる部分も、SPDRゴールド・シェアの[email protected]の書面による許可なしに、いかなる方法でも複製することはできません。いかなる場合でも、それを売却オファーまたはそれに記載されている有価証券またはその他の商品を購入するオファーの勧誘として使用または考慮されるべきではありません。「SPDRゴールド・シェアはこの情報が正確である完全であり、そのようなものとして信頼されるべきではありません。 SPDR Gold Sharesは、このファイルに含まれるデータに依拠した結果生じたいかなる損害、損害、費用またはクレームについても責任を負いません。 "

"注:LBMAゴールドプライスはLBMAゴールドプライスが使用されています。 "

" *注:2015年3月20日以降、トラストは、トラストのゴールドの価値を決定する際に金の価格としてLBMAゴールドプライスPMを使用しています。この日以前は、トラストはLondon PM Fixを使用しましたが、これは2015年3月19日に廃止されました。LBMA金価格に関するすべての情報は、情報提供のみを目的として提供されています。限られたICEベンチマーク政権は、価格や価格を参照することができるための基盤となる製品の正確性について一切の責任や義務を負いません「

答えて

0

あなたは使用することができます。

import requests 
from pandas.compat import StringIO 
dls = "http://www.spdrgoldshares.com/assets/dynamic/GLD/GLD_US_archive_EN.csv" 

r = requests.get(dls) 
daily_prices = pd.read_csv(StringIO(r.text), skiprows=6) 

print (daily_prices.head()) 

      Date GLD Close LBMA Gold Price NAV per GLD in Gold \ 
0 18-Nov-2004  44.38   $442.00   100.000000 
1 19-Nov-2004  44.78   $445.60   99.998900 
2 22-Nov-2004  44.75   $447.80   99.995600 
3 23-Nov-2004  45.05   $448.15   99.994500 
4 24-Nov-2004  45.05   $448.60   99.993400 

    NAV/share at 10.30 a.m. NYT Indicative Price of GLD at 4.15 p.m. NYT \ 
0       44.2         44.305 
1     44.55951167         44.694 
2     44.77803823         44.903 
3     44.81255136         44.812 
4     44.85705902         44.952 

    Mid point of bid/ask spread at 4.15 p.m. NYT# \ 
0           $44.37 
1           $44.78 
2           $44.95 
3           $44.74 
4           $45.00 

    Premium/Discount of GLD mid point v Indicative Value of GLD at 4.15 p.m. NYT \ 
0            0.146%        
1            0.192%        
2            0.105%        
3           -0.160%        
4            0.095%        

    Daily Share Volume \ 
0    5992000 
1   11655000 
2   11976800 
3    3139000 
4    6052700 

    Total Net Asset Value Ounces in the Trust as at 4.15 p.m. NYT \ 
0           260000.00    
1           1859994.06    
2           2799952.98    
3           2799952.98    
4           3099933.30    

    Total Net Asset Value Tonnes in the Trust as at 4.15 p.m. NYT \ 
0            8.09    
1            57.85    
2            87.09    
3            87.09    
4            96.42    

    Total Net Asset Value in the Trust 
0      114920000.00 
1      828806907.20 
2      1253785205.50 
3      1254751438.19 
4      1390568824.08 

理由:

daily_prices = pd.read_csv(dls, skiprows=6) 
print (daily_prices.head()) 

HTTPError: Forbidden

関連する問題