私は、定義された概念空間(ここではlearning as it relates to work)に関連して、800k +学術論文を関連性(1)または無関係性(0)として分類する最も効果的かつ簡単な方法を模索します。 データである:タイトル&アブストラクト及び/又は封入のためのいくつかのしきい値を生じさせる機能を確立することによって、教師付き機械学習を含む、任意の手法を用い、あるいは組み合わせてもよ
私はWekaでクラシファイアを構築しようとしています。トレーニングとテストという2つのデータセットがあります。 2つのファイルは同じ番号と種類の属性で同じです。しかし、weka探検家は私にTrainとTest setが互換性がないと言っているエラーを与えています。このエラーを解決するには?ここで は、二組のスナップです: そのウィキ内を検索training set testing set