html-content-extraction

0熱

3答えて

私はHTMLフォームを持っているため、ユーザーは特定の質問に他のテキストボックスを追加できるはずです。任意のテキスト入力の前に、ドロップダウンメニューの選択があり、各選択の後にテキストボックスが表示されます（選択、可視テキストボックス数の変更にも依存します）。ここにはJavaScriptがあります。 var var1=1; function addAffiliation(){

-2熱

3答えて

PHPのhtmlページの内容を抽出する

<body>から始まり、</body>で終わるHTMLページの内容をPHPで抽出する方法はあります。サンプルコードを投稿できる人がいれば

0熱

1答えて

Boilerpipeを使ってHTMLから記事の見出しを抽出する（ボイラパイプを使用）

ボイラパイプでは、ウェブページから記事のテキストだけを抽出して、HTMLのすべてを整理することができます。しかし、どのように記事の見出しを抽出することができますか？ページのタイトルを使用する方法がありますが、間違っていて不要な単語が含まれています（例： "title - sitename"）。もう1つのアイデアは、<h1>と</h1>の間のテキストを見つけることですが、私はまだ解決策をいくつか質

5熱

5答えて

HTMLページをWordPressに統合するには？

私はHTML（index.html）にページを持ち、images、css、jsという名前のフォルダを使用しています。今私はワードプレスでこれを行う必要があります。 HTMLをWordPressに変換するプラグインか、WordPressでこれを行うための他の方法はありますか？私を助けてください...私はワードプレスの初心者です。

1熱

1答えて

iOS - HTMLを標準テキストに変換する

私のアプリケーションでは、ニュースサーバーからhtmlファイルを受け取ります。受信後、タグ、画像、URLアンカーなどを削除して、テキストをテキスト表示で表示したいと考えています。 websiteは、私が探しているものと同様の機能を持っています。ウェブサイトは入力としてhtmlを取り、タグを削除し、プレーンテキストを結果として表示します。私は私のアプリで同様の機能を達成し、受け取ったニュースのテキ

2熱

1答えて

collabnet htmlのすべてのインラインCSSを抽出します

該当するhtmlのすべてのインラインスタイルを抽出したいと思います。以下例えばは、インラインCSSを抽出しようとするため、当該HTMLである： <div id="concernedHtmlPortion" style="style1"> <div style="style2"> <div style="style3;style4">Hello World!!</div>

1熱

1答えて

vbaからhtmlリストへの値の挿入

vbaの.valueメソッドを使用してリスト内のデータを操作できました。しかし、特定の値を更新しようとすると、その値は空白として埋められ、変更されません。私はこのフィールドに日付をプッシュしようとしていますが、日付はカレンダーから日付をボックスに入れるリストの隣のカレンダーから取られます。ドームエクスプローラを使用するときは、オプション値を変更するだけで、フィールドの日付が変更されます。この同じオ

0熱

1答えて

は、ウェブサイト

のソースコードの取得私は、SharePoint 2010のサイトからソースコードを取得するには、次のコードを使用していました。これでSharePointは2016に移行されました。ソースコード内の特定のコンテンツを表示できなくなりました。ただし、サイトの構造を表示するには、たとえばクロムの統合Web開発ツールを使用することが可能です。この場合、私の探しているコンテンツも表示されます。この情報

1熱

1答えて

Django-haystackは静的コンテンツを検索します

私のDjango 1.10アプリはHaystack + Elastic Searchを使用して検索機能を提供します。モデルデータにはうってつけですが、静的コンテンツ（基本的にHTMLファイル）でも動作させる必要があります。私はHTMLファイル（BeautifulSoup？）からコンテンツをスクラップしてデータベースに保存することを考えていました。この方法でテンプレートのコンテンツをインデックスに

0熱

1答えて

HTMLコードからURLを正しく抽出するにはどうすればよいですか？

私のコンピュータの.txtファイルにウェブサイトのHTMLコードを保存しました。しかし、スクリプトは最初のURLを出力し、全てではなく、他のリンク def get_net_target(page): start_link=page.find("href=") start_quote=page.find('"',start_link) end_quote=page.fi