information-extraction

    1

    4答えて

    私はPHPベースのショッピングアプリケーションに取り組んでいます。私は、私が知っている同じ製品を表す文字列のリストを持っています。これらの文字列には、完全な製品名またはその一部(通常、ブランド名+モデル名の完全な製品名)が含まれている可能性があります。 このような製品名の抽出を行うには、どのような方法が最適かと思います。ここで例えば 、同じ製品を表す文字列のリスト: TKG BOUILLOIRE

    124

    6答えて

    iOS電子メールクライアントでは、電子メールに日付、時刻、または場所が含まれている場合、そのテキストはハイパーリンクになり、単にリンクをタップするだけで予定を作成したり、地図を見ることができます。それは、英語のメールだけでなく、他の言語でも機能します。私はこの機能が大好きで、彼らがどのようにそれをするのか理解したいと思います。 これを行う単純な方法は、多くの正規表現を使用してすべてを実行することで

    1

    1答えて

    いくつかの概念のためにいくつかのドキュメントとオントロジーがあります。与えられた文書からこれらの概念を自動的に抽出し、トリプルを作成するフレームワークはありますか?オントロジには特殊なプロパティが含まれている必要がありますか? 私はUIMAを見つけましたが、私の知る限りUIMAに理解されるように、私はこのようなものだけで行うことができます。 がConceptMapperで をこの辞書を使用するオン

    0

    1答えて

    私はいくつかのCRMシステムから電子メールを受信するWebサービスを構築しています。メールには、通常、テキストステータスが含まれます。 「受信済み」または「完了済み」とフリーテキストコメント。 受信メールの形式が異なります。一部のシステムではステータス「Status:ZZZZZ」といくつかの「Action:ZZZZZ」が呼び出されます。フリーテキストは、時々、状態の前に現れ、何かの後に現れることが

    -1

    2答えて

    私は、以下の例のようなものを含む約1000ページをローカルにディスクに保存しています。 <html> <body> <li>User Dave<sup><a href="" title="" onClick="" class="">?</a></sup></li> <li>UserID<sup><a href="" title="" onClick="" class="">?</a></su

    4

    6答えて

    私が探しているもののHTMLを解析するよりも、ウェブページから情報を抽出するより良い方法があるかどうかを知りたいと思います。つまり、「imdb.com」からムービーの評価を抽出する 現在、IndyHttpコンポーネントを使用してページを取得していますが、strUtilsを使用してテキストを解析していますが、コンテンツは限られています。

    1

    2答えて

    私がしたいのは、生の自然なテキストを解析し、日付を表すすべてのフレーズを見つけることです。私は、マークアップされた日付へのすべての参照で、かなり大きなコーパスを持って : I met him <date>yesterday</date>. Roger Zelazny was born <date>in 1937</date> He'll have a hell of a hangover <d

    9

    2答えて

    私は以下のオープンソースツールについて知っていますが、それぞれの優れた比較方法は見つかりませんでした。フレーズ抽出を使用する準備と ツール: KEA MAUI(http://code.google.com/p/maui-indexer/) ドラゴン、xTractます(http://ドラゴン.ischool.drexel.edu/xtract.asp) Lingpipe(http://alias-i

    11

    2答えて

    私はいくつかの国や言語のニュース記事のコレクションから「エンティティ名」を抽出するためのPythonスクリプトを作成しています。 驚くべきDBPedia構造のknwoledgeを利用したいと思います。たとえば、「エジプトのアーティスト」の名前と「カナダの企業」の名前を検索したいとします。 (これらの情報は、SQL形式にあった場合、私は何の問題もなかっただろう。) 私はDBpediaのコンテンツをダ

    0

    1答えて

    可変ステップサイズ(具体的にはode113インテグレータが使用されています)の積分プロセスでは、ボディの位置は時間とともにファイルに格納される加速度によって決定されます、1つは時間、残りは加速)。しかしながら、上述のプロセスによる統合ステップに失敗したため、加速データ用のファイルは、位置データ用の対応するファイルより多くの行を有する。どのようにして、加速度データの正しいデータを抽出し、位置データフ