5

opencalaisが各エンティティに関連して返す関連性スコアは何ですか?それは何を意味し、どのように解釈されるのですか?私はこのことについての洞察に感謝するでしょう。OpenCalaisの妥当性スコアの理解

答えて

5

それらのdocumentation状態:関連性機能は、それぞれの一意のエンティティの重要度を検出し、0-1の範囲内の関連性スコアを割り当てます(1が最も重要で重要です)。

「関連性」が正確に何を意味するのか説明していませんが、エンティティの中心性を文書の談話に定量化すると期待されます。これは、ランダムな文書(TF-IDF参照)の予想頻度と比較して、この文書の頻度を述べるエンティティのような要因によって影響を受ける可能性が高いが、より洗練された談話分析も含まれる可能性がある。

+0

ありがとうジョン。確率的スコアだと思いますか?彼らはパーセンテージとしてそれを表現しているので、私は確率的なスコアであるかもしれないかと思っていましたが、私はそうではないと感じています。あなたはこれをどう受けますか?私のアプリケーションは、テキスト文書をその中の重要なエンティティにマップします。文書にマッピングするのに十分な重要性を示すスコアの範囲はどれですか?私はあなたの応答に感謝します。 – Ninja

+0

こんにちは忍者。私は推測することしかできませんが、それは本当の確率ではないと推測します。私の最善のアドバイスは、いくつかの実験を行い、あなたによく見えるものを見ることです。私はあなたがデータ分析の10分または15分以内に合理的な閾値を選ぶことができると思います。あなたは、重要な要素を欠いているか、疑わしいものを含んでいるか、どちらがより重要かを決定する必要があります。しかし、それはかなり主観的です。 –

+0

アドバイスいただきありがとうございます! – Ninja

関連する問題