私はテキストファイルに変換した巨大なHTMLファイルを持っています。 (ファイルはFacebookのホームページのソースです)。テキストファイルには、特定のキーワードがある場所にあると仮定します。たとえば、「some_keyword:[bla bla]」と入力します。 some_keywordの後ろにあるすべての異なるbla blasをどのように出力すればよいでしょうか?巨大なファイル内のキーワードの内容を検索して操作する
{id:"1126830890",name:"Hillary Clinton",firstName:"Hillary"}
この形式のページには50種類の名前があるとします。テキストが非常に大きく、それを読んだり()したり、その行を検索しようとするとクラッシュすることを考えれば、 "name:"の後ろに続くすべての名前をどのように表示しますか?
サンプルファイル:ファイルにデータを足すための責任者なので、あなたのコメントに基づいて
shortProfiles:{"100000094503825":{id:"100000094503825",name:"Bla blah",firstName:"Blah",vanity:"blah",thumbSrc:"https://scontent-lax3-1.xx.fbcdn.net/v/t1.0-1/c19.0.64.64/p64x64/10354686_10150004552801856_220367501106153455_n.jpg?oh=3b26bb13129d4f9a482d9c4115b9eeb2&oe=5883062B",uri:"https://www.facebook.com/blah",gender:2,i18nGender:16777216,type:"friend",is_friend:true,mThumbSrcSmall:null,mThumbSrcLarge:null,dir:null,searchTokens:["Bla"],alternateName:"",is_nonfriend_messenger_contact:false},"1347968857":
このデータはJSON形式で保存されていますか? –
@MoinuddinQuadriいいえ、元はHTMLで、これをtxtファイルに変換しました。それはHTMLの助けとしてそれを保つだろうか? – Nathan
答えを追加しました。あなたがファイルにデータを書き込む責任があるからです。それを有効なjson形式で記述します。 PythonでJSONモジュールをチェックしてください:https://docs.python.org/2/library/json.html –