one-hot-encoding

0熱

1答えて

ホットカーディナリティ変数のpandas get_dummiesが1つのホットエンコーディングを使用して多数の新機能を作成する

データセットに複数の上位枢要変数があり、それらをダミーに変換したい。それらのすべては500以上のレベルを持っています。私がpandas get_dummiesを使用したとき、行列が大きくなり、プログラムがクラッシュしました。 pd.get_dummies(data, sparse=True, drop_first=True, dummy_na=True) 私は1つのホットエンコーディングを使用

1熱

1答えて

ワンホットエンコーディング後のフィーチャー名の取得

私は最近、ワンホットエンコーディングで変換したデータセットを持ち、それにラッセルロジスティック回帰を訓練しました。私は非ゼロ係数のリストを取得しようとしています。私はsklearnを通して係数のリストを得ることができますが、私は1つのホットエンコーディングの後にそれらをデータにマップする方法がわかりません。データセット（事前に1つのホットエンコーディングは以下の通りです） {'acc_now_d

3熱

1答えて

巨大なデータのためのPython：ワンホットエンコード

文字列ラベルをワンホットエンコードにエンコードしようとすると、メモリの問題が引き続き発生します。約500万行と約10000種類のラベルがあります。私は以下のが、キープ取得メモリエラーを試してみました： import numpy as np def one_hot_encoding(y): unique_values = set(y) label_length = len(u

0熱

1答えて

1つのホットエンコーディング - 1dの配列に格納されたデータ

私は1次元配列を持っていますので、私のデータセットのカテゴリ的な特徴を以下のように格納しています。（各データインスタンスは多くのカテゴリに属し、コンマ） Administration Oral ,Aged ,Area Under Curve ,Cholinergic Antagonists/adverse effects/*pharmacokinetics/therapeutic use ,Cir

0熱

1答えて

tensorflow 0.8 1ホットエンコーディング

私は次のようにエンコードに見えるしたいデータ： print (train['labels']) [0 0 0 ...、42 42 42] は0~42から行く43個のクラスがあります今、私は、次のようにそれを使用しようとしたので、バージョン0.8でtensorflowは1つのホットエンコーディングのための新機能を持っていることを読む： trainhot=tf.one_hot(train['la

1熱

1答えて

Tensorflow埋め込みルックアップを使用してワンショットエンコーディング

私は現在埋め込みを使用したいonehotエンコーディングを持っています。しかし、私は embed=tf.nn.embedding_lookup(embeddings, train_data) print(embed.get_shape()) embed data shape (11, 32, 729, 128) 呼び出すときに、この形状は（11、32、128）でなければなりませんが、trai

3熱

2答えて

Tensorflowでワンホットラベルをどのようにデコードしますか？

TensorFlowのワンホット値から単一の整数にデコードまたは変換する方法の例は見つかりませんでした。私はtf.one_hotを使用していましたが、私のモデルを訓練することができましたが、分類後にラベルを理解する方法についてちょっと混乱しています。私のデータは、私が作成したTFRecordsファイルを介してフィードされています。私はファイルにテキストラベルを格納することを考えましたが、動作させ

0熱

1答えて

Sklearnが疎行列を与えられたときにValueErrorをスローする

機能が疎行列で表現されているときにSVM分類器が値エラーをスローしますが、機能が密集して表現されるとエラーは発生しません。私は自分のフィーチャセットでOne Hot Encodingを実行し、エンコードされた出力を新しいフィーチャのリストに追加するコードを持っています。 1つのホットエンコーディングの出力が.toarray（）を使用して密な配列に変換されると、私のSVM分類器は正常に動作します。

3熱

1答えて

テキストコーパスからの単語の1つのホットエンコーディング

テンソルフローを使用して、ボキャブサイズのスパースベクトルで表され、その特定の単語のインデックスが1に等しい各単語で、単語のホットエンコーディングを1つ作成するにはどうすればよいですか？何か等oneHotEncoding（ワード= [ 'A'、 'B'、 'C'、 'D']） - > [[1,0,0,0]、[0,1、 0,0]、[0,0,1,0]、[0,0,0,1]]？

0熱

1答えて

ダミーを使用した1つのホットエンコーディングR

ほとんど説明できない特定のことについては、ヘルプが必要です。次のコード library(dummies) columna <- c(1,2,3) columnb <- c("AR","AT","AF") columnc <- c("word1", "word2", "word3") alldata <- data.frame(columna,columnb,columnc) allda