one-hot-encoding

    0

    1答えて

    データセットに複数の上位枢要変数があり、それらをダミーに変換したい。それらのすべては500以上のレベルを持っています。私がpandas get_dummiesを使用したとき、行列が大きくなり、プログラムがクラッシュしました。 pd.get_dummies(data, sparse=True, drop_first=True, dummy_na=True) 私は1つのホットエンコーディングを使用

    1

    1答えて

    私は最近、ワンホットエンコーディングで変換したデータセットを持ち、それにラッセルロジスティック回帰を訓練しました。私は非ゼロ係数のリストを取得しようとしています。私はsklearnを通して係数のリストを得ることができますが、私は1つのホットエンコーディングの後にそれらをデータにマップする方法がわかりません。 データセット(事前に1つのホットエンコーディングは以下の通りです) {'acc_now_d

    3

    1答えて

    文字列ラベルをワンホットエンコードにエンコードしようとすると、メモリの問題が引き続き発生します。約500万行と約10000種類のラベルがあります。私は以下のが、キープ取得メモリエラーを試してみました: import numpy as np def one_hot_encoding(y): unique_values = set(y) label_length = len(u

    0

    1答えて

    私は1次元配列を持っていますので、私のデータセットのカテゴリ的な特徴を以下のように格納しています。(各データインスタンスは多くのカテゴリに属し、コンマ) Administration Oral ,Aged ,Area Under Curve ,Cholinergic Antagonists/adverse effects/*pharmacokinetics/therapeutic use ,Cir

    0

    1答えて

    私は次のようにエンコードに見えるしたいデータ: print (train['labels']) [0 0 0 ...、42 42 42] は0~42から行く43個のクラスがあります 今、私は、次のようにそれを使用しようとしたので、バージョン0.8でtensorflowは1つのホットエンコーディングのための新機能を持っていることを読む: trainhot=tf.one_hot(train['la

    1

    1答えて

    私は現在埋め込みを使用したいonehotエンコーディングを持っています。しかし、私は embed=tf.nn.embedding_lookup(embeddings, train_data) print(embed.get_shape()) embed data shape (11, 32, 729, 128) 呼び出すときに、この形状は(11、32、128)でなければなりませんが、trai

    3

    2答えて

    TensorFlowのワンホット値から単一の整数にデコードまたは変換する方法の例は見つかりませんでした。 私はtf.one_hotを使用していましたが、私のモデルを訓練することができましたが、分類後にラベルを理解する方法についてちょっと混乱しています。私のデータは、私が作成したTFRecordsファイルを介してフィードされています。私はファイルにテキストラベルを格納することを考えましたが、動作させ

    0

    1答えて

    機能が疎行列で表現されているときにSVM分類器が値エラーをスローしますが、機能が密集して表現されるとエラーは発生しません。 私は自分のフィーチャセットでOne Hot Encodingを実行し、エンコードされた出力を新しいフィーチャのリストに追加するコードを持っています。 1つのホットエンコーディングの出力が.toarray()を使用して密な配列に変換されると、私のSVM分類器は正常に動作します。

    3

    1答えて

    テンソルフローを使用して、ボキャブサイズのスパースベクトルで表され、その特定の単語のインデックスが1に等しい各単語で、単語のホットエンコーディングを1つ作成するにはどうすればよいですか? 何か 等oneHotEncoding(ワード= [ 'A'、 'B'、 'C​​'、 'D']) - > [[1,0,0,0]、[0,1、 0,0]、[0,0,1,0]、[0,0,0,1]]?

    0

    1答えて

    ほとんど説明できない特定のことについては、ヘルプが必要です。 次のコード library(dummies) columna <- c(1,2,3) columnb <- c("AR","AT","AF") columnc <- c("word1", "word2", "word3") alldata <- data.frame(columna,columnb,columnc) allda