information-extraction

1熱

4答えて

私はPHPベースのショッピングアプリケーションに取り組んでいます。私は、私が知っている同じ製品を表す文字列のリストを持っています。これらの文字列には、完全な製品名またはその一部（通常、ブランド名+モデル名の完全な製品名）が含まれている可能性があります。このような製品名の抽出を行うには、どのような方法が最適かと思います。ここで例えば、同じ製品を表す文字列のリスト： TKG BOUILLOIRE

124熱

6答えて

Appleは電子メールで日付、時刻、住所をどのように見つけることができますか？

iOS電子メールクライアントでは、電子メールに日付、時刻、または場所が含まれている場合、そのテキストはハイパーリンクになり、単にリンクをタップするだけで予定を作成したり、地図を見ることができます。それは、英語のメールだけでなく、他の言語でも機能します。私はこの機能が大好きで、彼らがどのようにそれをするのか理解したいと思います。これを行う単純な方法は、多くの正規表現を使用してすべてを実行することで

1熱

1答えて

ユーザ定義ドメインモデルのセマンティック注釈のためのフレームワーク

いくつかの概念のためにいくつかのドキュメントとオントロジーがあります。与えられた文書からこれらの概念を自動的に抽出し、トリプルを作成するフレームワークはありますか？オントロジには特殊なプロパティが含まれている必要がありますか？私はUIMAを見つけましたが、私の知る限りUIMAに理解されるように、私はこのようなものだけで行うことができます。がConceptMapperでをこの辞書を使用するオン

0熱

1答えて

テンプレートを使用してテキストからデータを抽出する

私はいくつかのCRMシステムから電子メールを受信するWebサービスを構築しています。メールには、通常、テキストステータスが含まれます。「受信済み」または「完了済み」とフリーテキストコメント。受信メールの形式が異なります。一部のシステムではステータス「Status：ZZZZZ」といくつかの「Action：ZZZZZ」が呼び出されます。フリーテキストは、時々、状態の前に現れ、何かの後に現れることが

-1熱

2答えて

Python3.1を使用してHTMLページからデータを抽出するにはどうすればよいですか？

私は、以下の例のようなものを含む約1000ページをローカルにディスクに保存しています。 <html> <body> <li>User Dave<sup><a href="" title="" onClick="" class="">?</a></sup></li> <li>UserID<sup><a href="" title="" onClick="" class="">?</a></su

4熱

6答えて

ウェブデルファイから情報を抽出する最良の方法

私が探しているもののHTMLを解析するよりも、ウェブページから情報を抽出するより良い方法があるかどうかを知りたいと思います。つまり、「imdb.com」からムービーの評価を抽出する現在、IndyHttpコンポーネントを使用してページを取得していますが、strUtilsを使用してテキストを解析していますが、コンテンツは限られています。

1熱

2答えて

自然なテキストで日付を参照する方法はありますか？

私がしたいのは、生の自然なテキストを解析し、日付を表すすべてのフレーズを見つけることです。私は、マークアップされた日付へのすべての参照で、かなり大きなコーパスを持って： I met him <date>yesterday</date>. Roger Zelazny was born <date>in 1937</date> He'll have a hell of a hangover <d

9熱

2答えて

現在どのようなフレーズ抽出ツールが最新の状態になっていますか？

私は以下のオープンソースツールについて知っていますが、それぞれの優れた比較方法は見つかりませんでした。フレーズ抽出を使用する準備とツール： KEA MAUI（http://code.google.com/p/maui-indexer/）ドラゴン、xTractます（http：//ドラゴン.ischool.drexel.edu/xtract.asp） Lingpipe（http://alias-i

11熱

2答えて

DBPediaを使用するpythonスクリプトの例？

私はいくつかの国や言語のニュース記事のコレクションから「エンティティ名」を抽出するためのPythonスクリプトを作成しています。驚くべきDBPedia構造のknwoledgeを利用したいと思います。たとえば、「エジプトのアーティスト」の名前と「カナダの企業」の名前を検索したいとします。（これらの情報は、SQL形式にあった場合、私は何の問題もなかっただろう。）私はDBpediaのコンテンツをダ

0熱

1答えて

Matlabのファイルの正しいデータを抽出する

可変ステップサイズ（具体的にはode113インテグレータが使用されています）の積分プロセスでは、ボディの位置は時間とともにファイルに格納される加速度によって決定されます、1つは時間、残りは加速）。しかしながら、上述のプロセスによる統合ステップに失敗したため、加速データ用のファイルは、位置データ用の対応するファイルより多くの行を有する。どのようにして、加速度データの正しいデータを抽出し、位置データフ