2017-03-23 4 views
1

から隠されたHTMLコンテンツを取得するにはどうすればは、Pythonのは:そのため、私はそうrobobrowserを使用してライブラリから撮影したブックを再発行することができ、プログラムを作るしようとしているHTMLページ

1になっていました私のID
2)ログイン)それぞれの図書
3のチェックボックスにチェックを入れ)私はログインをして、ページの応答を印刷した後、それが実際のページのソースコードを印刷した提出

をクリックしてくださいすべてのチェックボックスと書籍の名前が存在するフォームのソースコードを除いて。

それはすなわち

 <tr> 
     <td valign="top"> 














    <form action="./selectedBooks" method="get" id="form1" target="nid"> 
    <table border="0" class="briefListTbl" cellspacing="0" cellpadding="0" 
    valign="top"> 
    <tbody><tr><td> 
    <table valign="top" border="0" cellspacing="0" cellpadding="0" height="100%" 
    width="100%"> 
     <tbody class="briefListHead"> 
    <tr align="middle"> 


      <td width="10%"> 
       AccNo. 
      </td> 

      <td width="40%"> 
       Title 
      </td> 

      <td width="15%"> 
       Author 
      </td> 

      <td width="15%"> 
       Due date 
      </td> 

      <td width="10%"> 
       Reserved 
      </td> 

      <td>Renew</td> 

    </tr> 
    </tbody></table>           
      </td></tr> 
     <tr> 
     <td class="briefListBody"> 

      <div class="scrollbarTbl" id="divTblScroll" style="overflow: auto; 
    height: 178px; width: 1176px;"> 
      <table class="briefListTbl" border="0" cellspacing="2" 
    cellpadding="0" width="100%" height="100%"> 
      <tbody valign="top"> 
      <tr class="briefListRow1" id="checkoutsRow1"> 

           <td width="10%">50884</td> 

         <td width="40%" align="left">Programming with C (005.133 
    GOT; 42)</td> 
         <td width="15%" align="left">Gottfried, Byron</td> 
         <td width="15%" align="left">24/03/2017</td> 
         <td width="10%" align="left">-</td> 
           <td align="center"><input type="checkbox" 
    name="selectedforRenewal" value="0"></td> 

         </tr> 

         <tr class="briefListRow2" id="checkoutsRow2"> 

           <td width="10%">51203</td> 

         <td width="40%" align="left">Engineering physics 
    (621PRA; 147)</td> 
        <td width="15%" align="left"> dr.psk formy</td> 
        <td width="15%" align="left">24/03/2017</td> 
       ` <td width="10%" align="left">-</td> 
           <td align="center"><input type="checkbox" 
    name="selectedforRenewal" value="1"></td> 

        </tr> 

        <tr class="briefListRow1" id="checkoutsRow3"> 

          <td width="10%">20810</td> 

        <td width="40%" align="left">Objective Mathematics (511 SHA 17)</td> 
        <td width="15%" align="left">SHA(R.D)</td> 
        <td width="15%" align="left">30/03/2017</td> 
        <td width="10%" align="left">-</td> 
          <td align="center"><input type="checkbox" name="selectedforRenewal" value="2"></td> 

        </tr> 

        <tr class="briefListRow2" id="checkoutsRow4"> 

          <td width="10%">22455</td> 

        <td width="40%" align="left">Elements of Mechanical Engineering (620 PRA 19)</td> 
        <td width="15%" align="left">holydon</td> 
        <td width="15%" align="left">03/04/2017</td> 
        <td width="10%" align="left">-</td> 
          <td align="center"><input type="checkbox" name="selectedforRenewal" value="3"></td> 

        </tr> 

        <tr height="100%"><td><input type="hidden" name="searchOrBrowse" value="checkouts"></td></tr> 
      </tbody> 
      </table> 
    </div> 


    </td> 
</tr> 
</tbody> 
<tbody><tr> 


       <td class="briefListFoot"> 

        <table border="0" width="100%" class="briefListFoot" cellspacing="0" cellpadding="0"> 
        <tbody><tr> 
         <td align="left" valign="top" width="0*" height="0*" nowrap=""> 

         </td> 
         <td align="middle" valign="center" height="0*"> 

           <a class="briefListHREFFoot" href="javascript:showpopupFrame('./renew');"><b>Renew</b></a> 

          </td> 

          <td align="right" valign="top" width="0*" height="0*" nowrap=""> 

           <a class="briefListHREFFoot">Next<img border="0" src="../images/button/nill.GIF" alt=""></a> 

         </td> 
        </tr> 
       </tbody></table></td> 



</tr> 


</tbody></table> 



       </form></td></tr> 

、同様の形式のソースコードを表示するようになっていたが、それは唯一の

<tr><td valign="top"> 
</td></tr> 
</table> 
</td> 
</tr> 
</table> 

と私のコードを印刷します。..

browser = RoboBrowser(parser='lxml', user_agent='Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.64 Safari/537.11', history=True, session=start) 


browser.open('http://61.12.27.181:8080/opac/html/checkouts') 
sign_in = browser.get_form(action='./memberlogin') 
sign_in['txtmemberid'].value = 'MyId' 
browser.submit_form(sign_in, submit=' Go ') 
box = browser.get_form(action='./selectedBooks') 
print(browser.parsed) 

全体tdタグがありません。なぜなら、それが起こっている理由は、私も同様にセッションを渡しているので、私はそれがrobobrowserのためだとは思わない
助けが必要ですか?

+0

html5パーサーのような別のパーサーを使用しようとします。それは私が美しいスープでフルHTMLを得るために使用しなければならなかったものです – chaos

+0

@chaosそれは今空白を示しています。 \t \t \t \t \t 代わりコンテンツ \t \t \t \tのwhiltespace –

答えて

0

この質問は、ネットワークタブ内に移動します)要素、すなわち

1を検査することで、ネットワーク]タブからスクリプトURLを追加することによって解決することができる要素ツールを検査します。
2)ok応答を持っているし、要求

幸運にRobobrowserrequests.get(url)browser.session.get(url_of_js_or_css)を使用jsurlまたはcssを入手!

関連する問題

 関連する問題