文書全体のテキストコンテンツを取得する方法は？

私はいくつかの点で、現在のページの言語を決定する必要がありChromeの拡張機能を構築しています。それを行うために、私の計画は、ページのテキストコンテンツ（または少なくともその一部）を抽出し、それを翻訳APIに渡すことです。しかし、私はちょうど、ドキュメントのすべてのtextNode Sを取得する任意の海峡進むべき道を見つけることができませんでした。文書全体のテキストコンテンツを取得する方法は？

あり、十分なテキストコンテンツがあるまで再帰的に$('body').contents()を分析することであるバックアップ計画があるが、それは少しサクサク感じ。おそらくもっと良い方法がありますか？

注：Chromeの拡張機能のAPI、それはそれの一部であったかのように、あなたのスクリプトは、ユーザーのページのDOMにアクセスすることができます。

出典

2010-11-20 artemave

あなたはクローム拡張機能の開発にPythonの実行ファイルを使用することができます方法はありますか？もしそうなら、 'sgmllib'モジュールの' SGMLParser'を使って実現することができます！ないJS –

ページの完全なHTMLで何をしますかを使用してこれを行う方法は非常に確認してください？ – kobe

、同じように簡単にjQueryなしjQuery text() method

$('body').text()

出典

2010-11-20 15:38:12

疑いの余地は明白;）nitpick申し訳ありません – artemave

、しかし、あなたがしたい： '$（ '体'）テキスト（）' – szeryf

右手はい@szeryf。私の謝罪と良いキャッチ！ –

を使用する：document.body.innerText;

出典

2010-11-20 16:18:16 pawel

IEの場合のみinnerText、そうでない場合はdocument.body.textContent – kennebec

PPKによると、どちらも多かれ少なかれクロスブラウザー（Firefoxでは存在しないinnerText、IEではtextContent）http://www.quirksmode.org/dom/w3c_htmlです。 HTML – pawel

彼らはしかし異なっている：http://stackoverflow.com/questions/1359469/innertext-works-in-ie-but-not-in-firefox/1359822#1359822 –

Javascriptを：

document.body.textContent

出典

2013-11-03 09:12:48 mortalis

文書全体のテキストコンテンツを取得する方法は？

答えて

関連する問題