2012-06-20 15 views
41

まず、questionを確認しましたが、answerは廃止されたサービスを指しています。
正規表現検索をサポートする検索エンジンはありますか?

インターネットコンテンツを正規表現で検索するためのWebベース(またはソフトウェア、私は気にしない)がありますか?

+0

私はあなたが達成しようとしていることを[詳細](http://whathaveyoutried.com/)で提供するならば、より簡潔な答えを得られると信じています。 –

+15

私は正規表現に基づいて結果を得ようとしています、私の質問のタイトルと全く同じです! – skafandri

+0

Google検索では、単純な正規表現の一致を見つけることができます。 [この回答](http://webapps.stackexchange.com/questions/19673/is-there-a-way-to-search-in-google-using-regular-expressions-regex/82769#82769)を参照してください。正規表現検索の例。 –

答えて

16

私が原因の著者と私の完全な連帯にここsuperuser.com questionから答えを書いてみましょう:Ask Metafilterから

引用:

キーワード検索を行うための唯一可能な方法数百テラバイト(またはそのインデックスが最近までのもの)の効率的なものは、単語の索引を事前計算することです。

実際、完全正規表現エンジンはチューリングが完了しており、無限のCPU時間とメモリの近くでうんざりする任意の正規表現を書くことができます。これらすべての理由から、正規表現検索を一般の人に提供することは技術的な狂気になります。

+0

待機中、小さなWebサービスを作成する場合は、そのようなサービスは非常に便利です)。しかし、フル機能のWeb Crowlerの実装について話しているのであれば、私はそれが狂気だと思うよりも(まあ、それは可能ですが、時間とMIPSの消耗品です)。 – gahcep

+9

時間がかかりすぎるクエリはタイムアウトになるので、狂っている必要はありません。 –

+1

@MikeBantegui Eh?式を完全な言語で評価するサービスはたくさんあります。時間がかかり過ぎると、それは諦めます。 – Navin

2

regexエンジンによるインスタント検索はありません。これは、ページの索引付け方法によるものと考えられます。ウェブにgrepを許可すると、多くの計算能力が必要になります。

+8

あなたのリンクは現在死んでいます –

0

完全正規表現検索を使用するサイトはほとんどありませんが、グーグルはマッチングを行う能力があります。あなたが達成しようとしていることに応じて、これで十分かもしれません。

GoogleGuideは、利用可能ないくつかのオプションでかなり深いようです。おそらく、検索したい種類のクエリの例を挙げると、解決策を見つけることができますか?

+1

私はこれをチェックしましたが、 、実際には非常に貧しい! \ paul * \(グーグルポールは**ウェイ**と\ paul * \\とは異なる)や\ paul {3}のような*シンプルな*(正規表現でできることと比べて単純な)検索は実行できません。 \そして他の多くの場合.. – skafandri

+0

これはまた力の検索のためにかなり興味深いhttp://www.johntedesco.net/blog/2012/06/21/how-to-solve-impossible-problems-daniel-russells-awesome- google-search-techniques/ – MutterMumble

1

dayyanが正しいです。検索エンジンを高速化する逆インデックスです。 100テラバイトのフラッシュディスクしか持っていなければ、ペタバイトのコンテンツで正規表現検索を高速化する方法はありません。キーワード検索、逆インデックス、問題ありません。

blekkoのweb grep(https://blekko.com/ws/+/webgrep)は正規表現をサポートしていますが、私たちが取得する検索のほとんどは、通常はHTML内にある定数文字列です:誰がマイクロフォーマットを使用していますか?誰がさまざまなjavascriptライブラリを使用していますか?誰がさまざまなコメントシステムを使用していますか?その他

私たちに正規表現をお送りいただきましたら、それを実行していただければ幸いです。

これらの検索を実行するには、クロールのすべてのHTMLに対して実行されるMapReduceジョブが必要です。だからこそ、答えを得るのに(一日か二日か)かかります。

+0

リンクが壊れています。 – Navin

+1

それは間違いなく、blekkoはIBMによって2015年3月27日に購入され、IBMはその日にblekkoの公開検索エンジンの動作を停止しました。 –