答えて
更新
HebMorph
は、私が誰だったItamar SYN-Hershkoに連絡しましたLuceneメーリングリストで活動しています.1年前、彼はLuceneのヘブライ・アナライザで作業していました。彼がアナライザーを完成したかどうか聞いた。彼の応答からの関連ビットは次のとおりです。
短いストーリーを作るために、私は を作成しませんでした。私は確かに言うことができる、まったく無料の/ オープンソースのヘブライ語のアナライザ Luceneはありません。私は だと確信しています 件名ですが、私が と言っているときにこれをするのは簡単な方法はありません。それは でもあるかもしれないが、Luceneはヘブライ語の検索のために を構築していないかもしれないが、私は 解決策が与えられなければならないことに同意する。確かに、 ヘブライ語の テキストを索引付けして検索する最も安全な方法は、 という特殊なステマーを使用することです。これを行った後でもLuceneとの統合は最も簡単な方法ではありません( )。 市場にあるヘブライ語の検索には、ほんの少しだけ良い解決策があります 私が知っているものはLuceneを で使っています。私は最近言及されているのLuceneに基づく市販製品はATTIVIOと呼ばれ、the ATTIVIO websiteは、ヘブライ語のサポートを持っていると主張をしている それらを接触させ、まだ応答がない...
を試してみました。 SIGTRS (Hebrew Text Retrieval interest group)には、Luceneベースであると主張するものがあります。discussion regarding ATTIVIOがあります。
明らかに、Luceneのためのまともなヘブライ語のアナライザーを作成することは可能ですが、現時点ではフリーアナライザーは利用できません。
うわー、ありがとう、一束! – Roey
問題ありません。それがうれしかったのでうれしいです。 ;) – Naaff
こんにちは、私は最終的に1つの作業を開始する時間があり、今のところそれは有望に見えます。参照:http://www.code972.com/blog/hebmorph/ Itamar。 – synhershko
dtsearchにはヘブライ語ステミングプラグイン「pensim」があります。 「wizcomtech.com」によって開発されたようです。
- 1. LuceneとLucene.Netのロシア語解析ツール
- 2. Lucene Highlighterとステミング解析ツール
- 3. luceneを使用したスペイン語解析ツール
- 4. ログ解析用のLinux言語/ツール
- 5. Luceneに影響されない空白解析ツールですか?
- 6. ヘブライ語の文字列は、ヘブライ語
- 7. クエリ解析ツール
- 8. スタックトレース解析ツール
- 9. Lattixアーキテクチャ解析ツール
- 10. ネイティブメモリリーク解析のツール
- 11. SVNログ解析ツール
- 12. Javaクラスロードビジュアリゼーション/解析ツール
- 13. AJAX +ヘブライ語
- 14. ヘブライ語SMS in
- 15. アラビア語/ヘブライ語とjQueryモバイル
- 16. MATLABコード解析ツールと可視化ツール
- 17. "Ad Hoc"字句解析ツール
- 18. コピー&ペースト静的解析ツール?
- 19. 3D形状解析用ツール
- 20. ベストSquidログファイル解析ツール
- 21. PowerBuilderのコード解析ツール
- 22. Android用メモリ/パフォーマンス解析ツール
- 23. ファイルを解析するツール
- 24. require.js依存解析ツール
- 25. スタティックコード解析ツールの作成
- 26. C++の例外解析ツール
- 27. C++コードベースの解析ツール
- 28. ヘブライ語アルファベットのPHP範囲
- 29. HTMLファイル内のヘブライ語テキスト
- 30. ASPにヘブライ語を表示
オープンソースコミュニティーがそれを作っていきます。真のステミングは膨大な人力を必要とする点では非常に難しいですが、いくつかの基本的なステミングは可能であり、おそらく最小ステミングはゼロステミングより優れていると私には思われます。私はおそらくこれについて私自身で作業を開始するでしょう。興味があれば、私に連絡してください。 –
...そして、最初のステップとして、hspell(3)の列挙を使用しようとします。効果的に準備が整っています! –