beautifulsoup

1熱

1答えて

このコードを実行すると、毎回属性が異なる順序で出力されます。なぜ誰が知っていますか？私はBeautifulSoup random/non-deterministicを検索しようとしましたが、何も見つかりませんでした。 from bs4 import BeautifulSoup html = """ <span class="pb-byline" itemprop="author" items

3熱

2答えて

ウェブページからすべてのリンクを集めるには？

Python 3を使って「もっと見るキャンペーン」からリンクを集めるには？私はこのページからすべての260604リンクを集めたいと思っていますか？これは、さらに以下のようにページを要求するために使用することができ https://www.gofundme.com/mvc.php?route=category/loadMoreTiles&page=2&term=sport&country=GB&in

1熱

2答えて

複数の再構成リストをパンダに追加する

私は一度に1つの病院を行うときに、私はイングランドのジョイントデータを廃止して、結果を正しいフォーマットにします。私は最終的にすべての病院で反復したいと思っていましたが、最初に3つの異なる病院の配列を作り、反復を理解することに決めました。私はちょうど1病院がある場合以下のコードは私のパンダのデータフレームにおける最終結果の正しい形式を与える：私の反復バージョンで import requests

0熱

1答えて

PythonでBeautifulSoupを使用して異なるデータを持つ繰り返しタグを使用してXMLファイルを解析する

私は今この問題を解決していますが、解決策はありません。 pub_ref = soup.findAll("publication-reference") with open('./output.csv', 'ab+') as f: writer = csv.writer(f, dialect = 'excel') for info in pub_ref: pat

1熱

1答えて

複数のページをbeautifulsoupでリストにスクラップ

私は、複数のページの暗号解読値を繰り返し、開かれた、最高の、そして終値を返す、Pythonのbeautifulsoup4を使ってスクレイパープログラムを書きました。問題の掻き分け部分はうまくいきますが、すべての通貨を私のリストに保存することはできません。最後のものだけがリストに追加されます。誰も私のすべてを保存する方法を教えてもらえますか？私は数時間の検索をしており、関連する回答を見つけることが

1熱

1答えて

BeautifulSoup子どもなしの文字列でタグを見つける

私はPython3とBeautifulSoup 4.4.0を使ってウェブサイトからデータを抽出しています。私はdivタグのテーブルに興味がありますが、どのデータがテーブル内にあるのかを知るためには、h4タグのテキストを取得してから、テーブルである兄弟を取得する必要があります。問題は、内側に別のタグがある場合、h4タグの1つにスパンがあり、BeautifulSoupが文字列値としてNoneを返すこと

1熱

1答えて

ESPN.com Python web scraping issue

私は、チームの成績を分析するために、自分の名簿の構成に基づいて分析を実行したいので、すべての大学のフットボールチームのロスターのデータを取得しようとしています。私のスクリプトは最初のページで作業しており、各チームを繰り返して各チームのロースターリンクを開くことができますが、私がチームのロスターページで実行している美しいスープコマンドはインデックスエラーを投げかけています。私がHTMLを見ると、美

0熱

1答えて

不正な形式のHTMLを処理します（終了タグなし）

私はlxmlパーサを介してHTMLを解析するのにBeautifulSoupを使用します。 <table>タグが適切に閉じられているものの <table id='reportTable' class='report-table' style='width:auto' cellspacing='0'><tr> <th>Номер<br>поезда<th>Дата<br>отправления<th

2熱

1答えて

なぜ美しいスープは "area"という名前の要素を正しく解析しないのですか？

私はbeautiful soupを使ってxmlドキュメントを解析するpythonスクリプトを書いています。ドキュメントの中には、「エリア」という名前の要素が含まれているものがあります。何らかの理由で、私の人生がこれらの要素を適切に解析することができない。彼らは常に空の<area/>要素として出てきます。ここでは何が起こっているかの最低限の例です。 #!/usr/bin/python3.5 fr

0熱

1答えて

テキストで美しいスープのアイテムを探すタグではない

私はウィキペディアのページからそれを掻き集めて特定の場所のエリアを取得しようとしています。例としてCumbriaを使用して（https://en.wikipedia.org/wiki/Cumbria）私は情報ボックスを得ることができます。 url = 'https://en.wikipedia.org/wiki/Cumbria' r = requests.get(url) soup = Bea