分類のためのテキストデータの扱い

離散値とテキストの文字列からなる入力データがあり、出力はタグのセットであると仮定します。分類のためのテキストデータの扱い

これをニューラルネットに入力できるデータに変換するには、テキスト入力の処理方法を理解することができません。

テキスト入力のみを使用して、思考ベクトルを生成するRNNが動作すると仮定しますが、入力データの残りの部分をどのようにフィードするのかは少しは不明です。

2016-10-11 angerman

RNNを使用してテキスト入力を処理する場合、RNNの出力を個別の機能のワンホットエンコーディングと連結することができます。次いで、連結されたベクトルを出力層に供給することができる（例えば、マルチラベルにわたるクロスエントロピー損失を計算するロジスティック）。

同様に、埋め込みレイヤーを使用して入力テキストをマッピングしている場合、個別のフィーチャの別の埋め込みも学習できます。 2つの埋め込みフィーチャファミリを連結して、出力レイヤに供給することができます。

2016-10-11 07:05:22 greeness

少し無関係なフォローアップの質問：あなたは年齢の4次元の埋め込みに手の込んだだろうか？ – angerman

私は離散的な特徴の例を作った。たとえば、18以下、19〜35,36〜45,46以上の有効な値があるとします。カーディナリティは低いので、埋め込みディメンションを低くしました。 – greeness

これをクリアしていただきありがとうございます！とても有難い。私は年齢を正規化しようとし、1つの次元のみを使用しました。しかし、この埋め込みは私にとって興味深いと思います！ – angerman

答えて