私はいくつかの列を含むデータベースを持っています。これらの列の1つに段落が含まれ、各行にはそれぞれ段落があります。 各段落に単語があり、すべての列の中で倍数を数えたいと思います。SQL - 単語頻度をカウントする
例:
What is your name ?
Hello, my name is Quentin
His name is Quentin
結果がでなければなりません:
- Name - 3
- is - 3
- Quentin - 2
私はいくつかの列を含むデータベースを持っています。これらの列の1つに段落が含まれ、各行にはそれぞれ段落があります。 各段落に単語があり、すべての列の中で倍数を数えたいと思います。SQL - 単語頻度をカウントする
例:
What is your name ?
Hello, my name is Quentin
His name is Quentin
結果がでなければなりません:
- Name - 3
- is - 3
- Quentin - 2
これはコメントのために長すぎます。
各段落の「単語」(ただしそれらを定義する)を含む新しいテーブルを作成することをお勧めします。
どのように単語を解析するかはあなた次第です。一つの方法は、出力に各行のidも、その後のような構造にこれを有効にするPythonなどのツールを使用します。そして、あなたが簡単にあなたの質問に答えるために、この表を使用することができます
id word pos
。
しかし、各段落に#と私はこれらを数えたいと思っています# これらの数を数えて分類する簡単な方法が必要です。# – leyh
@QuentinCapra 。 。 SQLは、このクエリの間違ったツールです。 –
ダブルスはどういう意味ですか? – TheGameiswar
あなたはこれまでに何を試しましたか?そして、手続き型言語ではなくSQLでこれを行う必要がある理由はありますか? – matt
PHP、Java、Cなどでこれを行うことをお勧めします。 – vivoconunxino