beautifulsoup

    1

    1答えて

    このコードを実行すると、毎回属性が異なる順序で出力されます。なぜ誰が知っていますか? 私はBeautifulSoup random/non-deterministicを検索しようとしましたが、何も見つかりませんでした。 from bs4 import BeautifulSoup html = """ <span class="pb-byline" itemprop="author" items

    3

    2答えて

    Python 3を使って「もっと見るキャンペーン」からリンクを集めるには?私はこのページからすべての260604リンクを集めたいと思っていますか?これは、さらに以下のようにページを要求するために使用することができ https://www.gofundme.com/mvc.php?route=category/loadMoreTiles&page=2&term=sport&country=GB&in

    1

    2答えて

    私は一度に1つの病院を行うときに、私はイングランドのジョイントデータを廃止して、結果を正しいフォーマットにします。私は最終的にすべての病院で反復したいと思っていましたが、最初に3つの異なる病院の配列を作り、反復を理解することに決めました。私はちょうど1病院がある場合 以下のコードは私のパンダのデータフレームにおける最終結果の正しい形式を与える:私の反復バージョンで import requests

    0

    1答えて

    私は今この問題を解決していますが、解決策はありません。 pub_ref = soup.findAll("publication-reference") with open('./output.csv', 'ab+') as f: writer = csv.writer(f, dialect = 'excel') for info in pub_ref: pat

    1

    1答えて

    私は、複数のページの暗号解読値を繰り返し、開かれた、最高の、そして終値を返す、Pythonのbeautifulsoup4を使ってスクレイパープログラムを書きました。問題の掻き分け部分はうまくいきますが、すべての通貨を私のリストに保存することはできません。最後のものだけがリストに追加されます。 誰も私のすべてを保存する方法を教えてもらえますか?私は数時間の検索をしており、関連する回答を見つけることが

    1

    1答えて

    私はPython3とBeautifulSoup 4.4.0を使ってウェブサイトからデータを抽出しています。私はdivタグのテーブルに興味がありますが、どのデータがテーブル内にあるのかを知るためには、h4タグのテキストを取得してから、テーブルである兄弟を取得する必要があります。問題は、内側に別のタグがある場合、h4タグの1つにスパンがあり、BeautifulSoupが文字列値としてNoneを返すこと

    1

    1答えて

    私は、チームの成績を分析するために、自分の名簿の構成に基づいて分析を実行したいので、すべての大学のフットボールチームのロスターのデータを取得しようとしています。 私のスクリプトは最初のページで作業しており、各チームを繰り返して各チームのロースターリンクを開くことができますが、私がチームのロスターページで実行している美しいスープコマンドはインデックスエラーを投げかけています。私がHTMLを見ると、美

    0

    1答えて

    私はlxmlパーサを介してHTMLを解析するのにBeautifulSoupを使用します。 <table>タグが適切に閉じられているものの <table id='reportTable' class='report-table' style='width:auto' cellspacing='0'><tr> <th>Номер<br>поезда<th>Дата<br>отправления<th

    2

    1答えて

    私はbeautiful soupを使ってxmlドキュメントを解析するpythonスクリプトを書いています。ドキュメントの中には、「エリア」という名前の要素が含まれているものがあります。何らかの理由で、私の人生がこれらの要素を適切に解析することができない。彼らは常に空の<area/>要素として出てきます。ここで は何が起こっているかの最低限の例です。 #!/usr/bin/python3.5 fr

    0

    1答えて

    私はウィキペディアのページからそれを掻き集めて特定の場所のエリアを取得しようとしています。例としてCumbriaを使用して(https://en.wikipedia.org/wiki/Cumbria)私は情報ボックスを得ることができます。 url = 'https://en.wikipedia.org/wiki/Cumbria' r = requests.get(url) soup = Bea