naivebayes

2熱

1答えて

Mushroom Data setにNaive Bayesを使用しようとしています。データセットは8124*23で、最初の列は応答変数{'edible','poisonous'}です。私は欠けているデータを排除しました。最終的なデータセットは5644*23です。以下は私が使ったコードです。 mushroom.data <- read.csv("mushroom.data",header = FAL

1熱

1答えて

スパークML確率指標マッピングへのナイーブベイクラス

質問非常に明白なように聞こえるかもしれませんが、私は答えを見つけるために多くの検索を行いましたが、完全な証明解決を得ることはできません。私はSpark MLパッケージを使用していますが、Naive Bayesを実行した後、確率の適切な結果を得ていますが、特定のクラス値を確率インデックスとマッピングする方法を見つけることはできません（どのインデックスがどのクラス値はラベル列からですが、私はプログラ

1熱

1答えて

機械学習PythonのNaive Bayesクラシファイア

私は機械学習を実験しており、多くの変数に基づいて予測を行うモデルを開発する必要があります。プログラムはmakeprediciton.csvファイル Outlook,Temperature,Humidity,Windy,Play rainy,hot,normal,TRUE, に予測を挿入する必要があります train.csv Outlook,Temperature,Humidity,Windy

0熱

1答えて

sklearn NBクラシファイア：個々のサンプルの実際の確率を得るにはどうすればいいですか？

私は、ハードウェア、ソフトウェア、なしのいずれかのカテゴリの単語を分類する機械学習プログラムを作成しています。私はsklearnのMultinomial Naive Bayes分類器を使っています。 predict（）関数はすべての単語の予測を提供しますが、単語が予測されたカテゴリと一致する実際の確率（float 0〜1.0の範囲）を見ることはできません。私はSklearnのサイトでもこれを見つけ

0熱

1答えて

新しいデータで訓練されたモデル予測を確認するにはどうすればいいですか

私はPythonでScikitライブラリの助けを借りてモデルを構築し、クロスバリデーションメソッドを使って訓練しテストします。それを構築した後、新しいデータでどのようにテストすることができますか？

0熱

1答えて

textblob naive bayesクラシファイアのトピック分類時間を短縮する方法

ベイク定理を使って分類モデルを保存するためにpickleを使用していますが、5600レコードの分類後に2.1 GBのファイルを保存しました。しかし、私はそのファイルを読み込むときに2分ほどかかりますが、テキストを分類するのに5.5分かかります。私はそれをロードし、分類するために次のコードを使用しています。 classifierPickle = pickle.load(open("classifie

1熱

1答えて

naive bayes scikit learn warning "DeprecationWarning：1d配列を渡す"

なぜなら私にはわからないNaive Bayesクラシファイアで1d配列の受け渡しが推奨されていません。しかし、何らかの理由で、私がモデルを作成したら、アイテムのリストをループしたいし、それぞれのアイテムについて、クラスを予測するためにナイーブな分類子を呼び出す必要があります。だから、私の訓練セットがXで、私の目標クラスセットがYであると想像してください。そして、サンプルxxの分類子を呼びたいと思い

0熱

1答えて

Pythonのデータピクルのエラー

データピクルに訓練データセットを保存する必要があります。私は次のコードを使用しました。 self.featureCounts = collections.defaultdict(lambda :0) self.featureVectors = [] self.labelCounts = collections.defaultdict(lambda :0) def SaveOnPickle(

2熱

1答えて

スパークナイーブベイズモデル永続性：理解してください＆

私はNaive Bayesベースの実装に取り組んでおり、モデルチューニングに関してはSpark 2.0を使用していますが、モデル、私はスパーク2のモデルパーシステンスのサポートをよく知っているが、私の懸念は、特に保存されたモデルのデータフォルダ内のナイーブなベイズのための保存されたモデルの内容にあり、依存するpiクラスの数に、我々は他の&モデルのデータフォルダの並べ替えコンテンツに実際のデータ

0熱

1答えて

Pythonのデータピクルのエラー

私のトレーニングデータセットをデータピクルに保存する必要があります。ここにコードがあります。このコードを実行するとエラーが発生しました。このエラーを修正するにはどうすればいいですか？ featureCountsとlabelCounts変数を2つのピクルスに保存する必要があります。ここで from __future__ import division import collections imp