2009-06-30 14 views
27

誰かが存在するかどうかは知りませんか?Luceneヘブライ語解析ツール

私はのmonthesのためにこれをグーグルでてきた

...

おかげで、あなたの質問に端を発した好奇心のうち

+0

オープンソースコミュニティーがそれを作っていきます。真のステミングは膨大な人力を必要とする点では非常に難しいですが、いくつかの基本的なステミングは可能であり、おそらく最小ステミングはゼロステミングより優れていると私には思われます。私はおそらくこれについて私自身で作業を開始するでしょう。興味があれば、私に連絡してください。 –

+0

...そして、最初のステップとして、hspell(3)の列挙を使用しようとします。効果的に準備が整っています! –

答えて

21

更新
HebMorph

は、私が誰だったItamar SYN-Hershkoに連絡しましたLuceneメーリングリストで活動しています.1年前、彼はLuceneのヘブライ・アナライザで作業していました。彼がアナライザーを完成したかどうか聞いた。彼の応答からの関連ビットは次のとおりです。

短いストーリーを作るために、私は を作成しませんでした。私は確かに言うことができる、まったく無料の/ オープンソースのヘブライ語のアナライザ Luceneはありません。私は だと確信しています 件名ですが、私が と言っているときにこれをするのは簡単な方法はありません。それは でもあるかもしれないが、Luceneはヘブライ語の検索のために を構築していないかもしれないが、私は 解決策が与えられなければならないことに同意する。確かに、 ヘブライ語の テキストを索引付けして検索する最も安全な方法は、 という特殊なステマーを使用することです。これを行った後でもLuceneとの統合は最も簡単な方法ではありません( )。 市場にあるヘブライ語の検索には、ほんの少しだけ良い解決策があります 私が知っているものはLuceneを で使っています。私は最近言及されているのLuceneに基づく市販製品はATTIVIOと呼ばれ、the ATTIVIO websiteは、ヘブライ語のサポートを持っていると主張をしている それらを接触させ、まだ応答がない...

を試してみました。 SIGTRS (Hebrew Text Retrieval interest group)には、Luceneベースであると主張するものがあります。discussion regarding ATTIVIOがあります。

明らかに、Luceneのためのまともなヘブライ語のアナライザーを作成することは可能ですが、現時点ではフリーアナライザーは利用できません。

+0

うわー、ありがとう、一束! – Roey

+0

問題ありません。それがうれしかったのでうれしいです。 ;) – Naaff

+4

こんにちは、私は最終的に1つの作業を開始する時間があり、今のところそれは有望に見えます。参照:http://www.code972.com/blog/hebmorph/ Itamar。 – synhershko

0

dtsearchにはヘブライ語ステミングプラグイン「pensim」があります。 「wizcomtech.com」によって開発されたようです。