フォーマットされたWebサイトからプレーンテキストを取得してUIWebViewで使用する方法

私がしたいことが可能かどうかはわかりませんが、私がやりたいことは何らかの形でウェブサイトからテキストを集めてヘッダー、フッター、背景、すべての書式設定し、スクロールビューなどでアプリケーションに配置してください。フォーマットされたWebサイトからプレーンテキストを取得してUIWebViewで使用する方法

私はあなたに例を挙げます...私がウィキペディアのiPhoneアプリを作っていたとします。犬のウィキ、ヘッダーなし、サイドバーなど、テキストのみ。これをどうやってやりますか？

私はこのためにサンプルコードを提供していないか、私が試したことや始めたことを理解していますが、これはちょうどこのケースで失われているからです！それは私がコードの完全な塊を望むという意味ではありません。どんな助けもします。これでうまくいかない場合は、アプリに含めるウェブページの「モバイルに最適化された」バージョンを作成するだけです。

おかげ

（編集：私は使用しようとしていた用語は「そのHTMLコーディングのWebページを取り除く」でした）

出典

2011-12-07 Andre C

あなたは間違ったやり方、あるいは間違った質問をしているかもしれません。

は、ターゲットのウェブサイトは、いくつかの種類のAPIまたはデータフィードを持っていますか？必要な情報をサイトから直接JSON形式またはXML形式で入手できますか？

私はあなたが技術を誤解したと思います。 HTMLは、書式設定とデータがハングアップしている単なるフレームワークです。

HTMLページを解析することは非常に大きな頭痛のように思えますが、最近ではほとんどすべてのサイトがサーバー側で部分的にまたは完全に生成されているため、結果。

一部のサイトでは、情報をメモリに隠し、他のサイトではたとえばajaxによって動的に情報を取得します。つまり、HTMLを解析するだけでデータを取得しようとすると、データはゼロになります。

しかし、あなたが知っておくべきもう一つの問題は、生成されたウェブサイトからのデータをコピーするだけで、著作権問題が発生する可能性があることです。

出典

2011-12-07 15:51:08 T9b

私は誰かのためにアプリケーションを作っていますが、私はそれらを盗聴してモバイル版をいくつかのページに作ってしまうことをやろうと思っていました。問題。 –

@AndreCあなたはHTMLだけを貼り付けるだけのコピーを試みましたか？あなたはCSSファイルへのリンクせずにHTMLファイルを取得そのように、あなたがしなければならないすべてはあなたのブラウザでHTMLファイル（ローカルに保存されている）を表示し、通常はあなたが見るすべては純粋なテキストです。これをテキストエディタにコピーすることができます。これは時間がかかりませんが、HTMLを解析するコードを書くよりも時間がかかりません – T9b

あなたはhtmlコードを解析し、必要な部分を検索しなければなりませんあなたが必要としない部分を "投げ捨て"ます。これは多かれ少なかれbruteforcingに似ており、ウェブサイトのコードは違っていてはいけません。したがって、この方法でパーサーを手作業で書く必要があります。しかし、おそらく原子またはRSSフィードがあり、これを解析できます。これははるかに簡単になり、rss/atomフィードはちょうどデータに関するものなので、ウェブサイトのレイアウトに依存しません。 rssを解析するには、NSXMLParserを試してみてください。そして、データから有効なhtmlページを作成してそれを提示しなければなりません。UIWebView

出典

2011-12-07 14:09:40 Pfitz

フォーマットされたWebサイトからプレーンテキストを取得してUIWebViewで使用する方法

答えて

関連する問題