html-content-extraction

    0

    3答えて

    私はHTMLフォームを持っているため、ユーザーは特定の質問に他のテキストボックスを追加できるはずです。任意のテキスト入力の前に、ドロップダウンメニューの選択があり、各選択の後にテキストボックスが表示されます(選択、可視テキストボックス数の変更にも依存します)。ここにはJavaScriptがあります。 var var1=1; function addAffiliation(){

    -2

    3答えて

    <body>から始まり、</body>で終わるHTMLページの内容をPHPで抽出する方法はあります。サンプルコードを投稿できる人がいれば

    0

    1答えて

    ボイラパイプでは、ウェブページから記事のテキストだけを抽出して、HTMLのすべてを整理することができます。しかし、どのように記事の見出しを抽出することができますか?ページのタイトルを使用する方法がありますが、間違っていて不要な単語が含まれています(例: "title - sitename")。 もう1つのアイデアは、<h1>と</h1>の間のテキストを見つけることですが、私はまだ解決策をいくつか質

    5

    5答えて

    私はHTML(index.html)にページを持ち、images、css、jsという名前のフォルダを使用しています。 今私はワードプレスでこれを行う必要があります。 HTMLをWordPressに変換するプラグインか、WordPressでこれを行うための他の方法はありますか?私を助けてください...私はワードプレスの初心者です。

    1

    1答えて

    私のアプリケーションでは、ニュースサーバーからhtmlファイルを受け取ります。 受信後、タグ、画像、URLアンカーなどを削除して、テキストをテキスト表示で表示したいと考えています。 websiteは、私が探しているものと同様の機能を持っています。ウェブサイトは入力としてhtmlを取り、タグを削除し、プレーンテキストを結果として表示します。私は私のアプリで同様の機能を達成し、受け取ったニュースのテキ

    2

    1答えて

    該当するhtmlのすべてのインラインスタイルを抽出したいと思います。以下例えば は、インラインCSSを抽出しようとするため、当該HTMLである: <div id="concernedHtmlPortion" style="style1"> <div style="style2"> <div style="style3;style4">Hello World!!</div>

    1

    1答えて

    vbaの.valueメソッドを使用してリスト内のデータを操作できました。しかし、特定の値を更新しようとすると、その値は空白として埋められ、変更されません。私はこのフィールドに日付をプッシュしようとしていますが、日付はカレンダーから日付をボックスに入れるリストの隣のカレンダーから取られます。ドームエクスプローラを使用するときは、オプション値を変更するだけで、フィールドの日付が変更されます。この同じオ

    0

    1答えて

    のソースコードの取得私は、SharePoint 2010のサイトからソースコードを取得するには、次のコードを使用していました。 これでSharePointは2016に移行されました。ソースコード内の特定のコンテンツを表示できなくなりました。 ただし、サイトの構造を表示するには、たとえばクロムの統合Web開発ツールを使用することが可能です。この場合、私の探しているコンテンツも表示されます。 この情報

    1

    1答えて

    私のDjango 1.10アプリはHaystack + Elastic Searchを使用して検索機能を提供します。モデルデータにはうってつけですが、静的コンテンツ(基本的にHTMLファイル)でも動作させる必要があります。 私はHTMLファイル(BeautifulSoup?)からコンテンツをスクラップしてデータベースに保存することを考えていました。この方法でテンプレートのコンテンツをインデックスに

    0

    1答えて

    私のコンピュータの.txtファイルにウェブサイトのHTMLコードを保存しました。しかし、スクリプトは最初のURLを出力し、全てではなく、他のリンク def get_net_target(page): start_link=page.find("href=") start_quote=page.find('"',start_link) end_quote=page.fi