4
データからストップワードを削除したいが、正確なワードが重要なので、ストップワードを削除したくない。 私はこのクエリを使用しました。postgresqlでステミングを行わずにストップワードを削除する
SELECT to_tsvector('english',colName)from tblName order by lower asc;
ストップワードを削除することはできますか?
おかげ
データからストップワードを削除したいが、正確なワードが重要なので、ストップワードを削除したくない。 私はこのクエリを使用しました。postgresqlでステミングを行わずにストップワードを削除する
SELECT to_tsvector('english',colName)from tblName order by lower asc;
ストップワードを削除することはできますか?
おかげ
独自のテキスト検索辞書や設定を作成します。
CREATE TEXT SEARCH DICTIONARY simple_english
(TEMPLATE = pg_catalog.simple, STOPWORDS = english);
CREATE TEXT SEARCH CONFIGURATION simple_english
(copy = english);
ALTER TEXT SEARCH CONFIGURATION simple_english
ALTER MAPPING FOR asciihword, asciiword, hword, hword_asciipart, hword_part, word
WITH simple_english;
それは次のように動作します。
SELECT to_tsvector('simple_english', 'many an ox eats the houses');
┌─────────────────────────────────────┐
│ to_tsvector │
├─────────────────────────────────────┤
│ 'eats':4 'houses':5 'many':1 'ox':3 │
└─────────────────────────────────────┘
(1 row)
あなたはそれをデフォルトにするためにsimple_english
にパラメータdefault_text_search_config
を設定することができますテキスト検索の設定。
私はこれを行ってから、この 'update tblName set cilName = to_tsvector( 'simple_english'、colName);'のようなクエリを作成し、このエラーを返します。 – Raha1986
'tsvector'を' varchar'カラムに格納するのはあまり意味がありません。特にそれを短く定義すると、値を保持できません。あなたは何をしようとしているのですか? –
クイック返信ありがとうございます。私はタグの列を持っている、彼らはいくつかの文字や文章することができます。タグは同じにすることができますが、これらのタグは見た目が異なります。私はストップワードとすべての文字を削除し、特有のタグを探したい。 – Raha1986