naivebayes

    2

    1答えて

    Mushroom Data setにNaive Bayesを使用しようとしています。データセットは8124*23で、最初の列は応答変数{'edible','poisonous'}です。私は欠けているデータを排除しました。最終的なデータセットは5644*23です。以下は私が使ったコードです。 mushroom.data <- read.csv("mushroom.data",header = FAL

    1

    1答えて

    質問非常に明白なように聞こえるかもしれませんが、私は答えを見つけるために多くの検索を行いましたが、完全な証明解決を得ることはできません。 私はSpark MLパッケージを使用していますが、Naive Bayesを実行した後、確率の適切な結果を得ていますが、特定のクラス値を確率インデックスとマッピングする方法を見つけることはできません(どのインデックスがどのクラス値はラベル列からですが、私はプログラ

    1

    1答えて

    私は機械学習を実験しており、多くの変数に基づいて予測を行うモデルを開発する必要があります。プログラムはmakeprediciton.csvファイル Outlook,Temperature,Humidity,Windy,Play rainy,hot,normal,TRUE, に予測を挿入する必要があります train.csv Outlook,Temperature,Humidity,Windy

    0

    1答えて

    私は、ハードウェア、ソフトウェア、なしのいずれかのカテゴリの単語を分類する機械学習プログラムを作成しています。私はsklearnのMultinomial Naive Bayes分類器を使っています。 predict()関数はすべての単語の予測を提供しますが、単語が予測されたカテゴリと一致する実際の確率(float 0〜1.0の範囲)を見ることはできません。私はSklearnのサイトでもこれを見つけ

    0

    1答えて

    私はPythonでScikitライブラリの助けを借りてモデルを構築し、クロスバリデーションメソッドを使って訓練しテストします。それを構築した後、新しいデータでどのようにテストすることができますか?

    0

    1答えて

    ベイク定理を使って分類モデルを保存するためにpickleを使用していますが、5600レコードの分類後に2.1 GBのファイルを保存しました。しかし、私はそのファイルを読み込むときに2分ほどかかりますが、テキストを分類するのに5.5分かかります。私はそれをロードし、分類するために次のコードを使用しています。 classifierPickle = pickle.load(open("classifie

    1

    1答えて

    なぜなら私にはわからないNaive Bayesクラシファイアで1d配列の受け渡しが推奨されていません。しかし、何らかの理由で、私がモデルを作成したら、アイテムのリストをループしたいし、それぞれのアイテムについて、クラスを予測するためにナイーブな分類子を呼び出す必要があります。だから、私の訓練セットがXで、私の目標クラスセットがYであると想像してください。そして、サンプルxxの分類子を呼びたいと思い

    0

    1答えて

    データピクルに訓練データセットを保存する必要があります。私は次のコードを使用しました。 self.featureCounts = collections.defaultdict(lambda :0) self.featureVectors = [] self.labelCounts = collections.defaultdict(lambda :0) def SaveOnPickle(

    2

    1答えて

    私はNaive Bayesベースの実装に取り​​組んでおり、モデルチューニングに関してはSpark 2.0を使用していますが、モデル、私はスパーク2のモデルパーシステンスのサポートをよく知っているが、私の懸念は、特に保存されたモデルのデータフォルダ内のナイーブなベイズのための保存されたモデルの内容にあり、依存するpiクラスの数に、我々は他の&モデルのデータフォルダの並べ替えコンテンツに実際のデータ

    0

    1答えて

    私のトレーニングデータセットをデータピクルに保存する必要があります。ここにコードがあります。このコードを実行するとエラーが発生しました。このエラーを修正するにはどうすればいいですか? featureCountsとlabelCounts変数を2つのピクルスに保存する必要があります。ここで from __future__ import division import collections imp