word2vec

    0

    1答えて

    単語ベクトルを合計して結果を比較する単純なアプローチを使用して、文比較の問題を解決しようとしています。私の目標は興味のある人にマッチさせることです。そのため、データセットは、趣味を説明する名前と短い文で構成されています。バッチはかなり小さく、数百人の人がいるので、私はdoc2vecを掘り下げる前に試してみたかったのです。 私はデータを完全に掃除し、ストップワードを除去し、トークン化し、lemmat

    0

    4答えて

    を使用している間、私は、リスト内の文字列の数が多い:リストの内容の 小さな例は次のとおりです。 [「機械学習」、「アップル」、「金融」、 "AI"、 "Funding"] 私はこれをベクトルに変換し、クラスタリング目的で使用したいと考えています。 それぞれのベクトルを見つけている間に、文中のこれらの文字列のコンテキストが考慮されていますか?私は文字列を含むだけでこのリストを持っている場合 は、どの

    0

    1答えて

    埋め込みとは何か、どのように訓練されているのか知っています。正確には、テンソルフローのドキュメントを参照しながら、私は2つの異なる記事に出くわしました。私はそれらの違いが何であるかを知りたい。 リンク1:最初のチュートリアルでTensorflow | Vector Representations of words 、彼らは明示的に特定のデータセットに埋め込みを訓練してきました。これらの埋込みを訓練

    0

    1答えて

    私はdoc2Vecとword2Vecについて読むために多数の文書を読みました。私は、単語をベクトルとして表現し、ベクトル加算、減算などの単純な演算を実行して単語間の意味のある類推をもたらすことがどれほど強力かを理解しています。 私がまだ理解できないことの1つは、このテクニックを使用してユーザーの感情を理解する方法です。 これらの手法を使用してユーザーの感情を分析する方法について詳しく説明してくださ

    2

    2答えて

    私は単語表現の埋め込みを研究しています。多くのdnnライブラリでは、埋め込みレイヤーをサポートしています。これは本当に素敵なチュートリアルです。 Word Embeddings: Encoding Lexical Semantics しかし、私はまだ埋め込み値を計算する方法がわからないです。以下の例では、訓練の前にも何らかの値を出力します。それはいくつかのランダムな重みを使用していますか? Emb

    1

    1答えて

    H2Oの使用は必須です。word2vecモデルを使用してテキストファイル(入力としてデータセット)にEmbeddingを実行し、ベクトル(配列)として出力を生成します。 word2Vecモデルは、C/C++で書かれたhttps://code.google.com/archive/p/word2vec/ の下にあります。 したがって、H2Oの使用をどのように実装できますか?

    0

    1答えて

    いつもより多くのnグラムのword2vecモデルを作りたいと思います。私が見つけたように、gensim.models.phraseのフレーズクラスは私が望むフレーズを見つけることができ、コーパスのフレーズを使用することができ、word2vecトレイン機能の結果モデルを使用することができます。 まず最初に、gensim documentationのサンプルコードとまったく同じようにします。 clas

    1

    1答えて

    私の理解では、word2vecは、2つのモードで実行することができるということである。 連続袋のワード(CBOW)(単語の順番は関係ありません) 連続スキップグラム(言葉の順序が重要) 私は、SparkのMLlibからCBOW実装を実行したいと思いますが、それはそれを行う方法を文書化し、その例から、私には明らかではありません。これはそのページに掲載されている例です。 から:https://spar

    0

    1答えて

    私は次のようにword2vecモデルを構築しています。 from gensim.models import word2vec, Phrases documents = ["the mayor of new york was there", "human computer interaction and machine learning has now become a trending rese

    1

    2答えて

    私はword2vec関数でRを介してh2oクラスターにグローブをインポートしようとしています。 これについてはDoes or will H2O provide any pretrained vectors for use with h2o word2vec? 事前訓練されたグローブをダウンロードして、400B.300d.txtファイルをh2oにインポートしようとしましたが、解析に問題がありました。