のために私たちが知っているグランドトゥルースは& R.再訓練アプローチは、NLCやR&R
グランドトゥルースが質問レベルのトレーニングデータであるがNLCを再訓練またはRに使用されます。
「それが今日どのように暑いですか、温度」
質問「それが今日どのように暑いのですか?」したがって、「温度」クラスに分類される。
アプリケーションが起動すると、実際のユーザーの質問が届きます。いくつかは同じです(つまり、実際のユーザーからの質問は、真実の質問と同じです)。いくつかは類似した用語です。いくつかは新しい質問です。クラス(NLCの場合)または回答(R & Rの場合)が適切かどうかを知るために、アプリケーションにフィードバックループがあるとします。
About the new questions, the approach seems to just add the them to the ground truth, which is then used to re-train the NLC/R&R?
For the questions with similar terms, do we just add them like the new questions, or do we just ignore them, given that similar terms can also be scored well even similar terms are not used to train the classifier?
In the case of the same questions, there seems nothing to do on the ground truth for NLC, however, to the R&R, are we just increase or decrease 1 for the relevance label in the ground truth?
ここでの主な問題は、アプリケーションがライブになった