2011-03-01 9 views
2

私たちは、あなたがすでに本当に良い検索エンジンが必要であることを知っているかもしれない、クラシファイドのウェブサイトを開発中です。私たちのプロジェクトでは、左側のフィルタリングメニューが必要です。とにかく、私はzend luceneを使うべきかどうか、あるいはlucene serverを自分でインストールし、検索ファイルをapiと接続するべきかどうかを尋ねていますか?パフォーマンス/ベンチマークの比較結果を見つけることができず、ここで質問したかったのです。私は、限界、利点、不利益の面であなたの意見を聞きたいと思います。あなたはPHPやluceneを使ってzend luceneの検索をお勧めします。

+0

エントリ数、言語、およびトラフィックの予測と再構築の頻度に関する情報をお送りください。これらの要素は、勧告において重要な役割を果たすことができる。 – allnightgrocery

+0

毎日のほとんどの10kデータエントリ(モデル、メイク、フィーチャなどの多くのプロパティを持つ中古車の分類)と、1か月あたり最大10億ページビュー。 –

答えて

4

私の経験では、Zend Luceneは少量のデータには適していますが、データを追加すると非常に速くなります。私は現在のプロジェクトでそれをカットしていなかったので、ルーゼンを怒らせる新しい選択肢を研究しなければなりませんでした。長い話を簡単にするために、私たちはSolrに行きました。これはApache Luceneをベースにしています。 70k +記事の索引作成は数時間から数分に短縮されました。

私は、Sphinxが私の決定で近い第2位に入ったと付け加えておきたいと思います。

+0

Jeff、Sphinxは、テキストベースのソリューションです。 「2ドア」「4ドア」オプション(複数フィールド)のような検索フィルターを用意することはできません。私はスフィンクスを使用していません。 Solrとzendについて実際に私たちのウェブサイトでは、 "限界"の観点から、毎日、最大10kのデータ入力(分類された広告)と約10億回のユニークなビュー(毎月)があります。だから私たちは索引付け時間ではなく、より多くの検索に集中しています。 (広告が入力された後にインデックスが自動化され、分ではなく1日に放棄されます) –

+0

インデックス容量の検索能力の数を控えています。 –

+1

あなたがこれらの種類の数字を話しているなら、Zend_Luceneソリューションを使用しないでください。 Zend_Luceneを使用して検索結果を待ってから9〜10秒かかり、Solrを使用してミリ秒になりました。それは70kレコードのためだった。 –

1

私はSolrを提案します - インストールに最小限の労力を要し、PHP interfaceがあります。また、faceting(サイドのフィルタ)の組み込みサポートもあり、かなりfast and scalableです。

+0

こんにちは!あなたはsolrとluceneについてのperformace chartの例を知っていますか? solrがluceneの上にあるためです。私は本当にzend lucene、lucene、solrの間にあり、まだ決めることができませんでした。 –

+0

SolrはLucene(ライブラリであり検索エンジンではない)の上に構築されています.2つの直接比較はありません。 Luceneを使用するコードを記述する必要があります。これはすでにSolrにあるコードと非常によく似ています。正しく構成されたSolrがLuceneを使用するカスタム実装よりも大幅に遅い場合、私は非常に驚くでしょう。他の人がSolrから得ているパフォーマンスを確認し、要件を満たしているかどうかを確認することをお勧めします。 – nikhil500

関連する問題