textmatching

    1

    6答えて

    テキストファイル(またはXMLファイル)を文字列全体として表現し、特定の文字列を検索(または一致)するにはどうすればよいですか?私はBufferedReaderのオブジェクト作成した :Scannerクラスを使用して //Scanner scantext = new Scanner(input); //Scanner scantext = new Scanner(input).useDelimi

    2

    1答えて

    varchar内のvarcharの出現を数える最善の方法は何ですか。 特定の組み合わせを見つけるために、テキストをループしないでください。 この選択のみ見つける最初 SELECT CASE WHEN CHARINDEX('!','HOW MANY TIMES IS ! IN THIS TEXT ? THIS IS MY QUESTION !') > 0 THEN 1 ELSE 0 END 戻り

    1

    2答えて

    私は一連の用語を含む2つの列を持つパンダを持っていますが、私の目的はcolumnのエントリに最も近いものを列Bから見つけることですA.私はTF-IDFを使用して2つの列の類似点を見つけましたが、この問題は個々の単語の出現を探し、一緒にグループ化された単語に優先順位を与えないことです。 一緒に発生する単語にどのように重みを付けるのですか? 「猫はマットに座っていた」という表現は、「馬が象の上に座って

    2

    1答えて

    私はPandasに2つの列を持っています:AとB、それぞれに用語の文字列が含まれています。私の目的は、列Aに最も似ている列Bのエントリを見つけることです。私はすでにTF-IDFを使ってこの操作を行っていますが、時には明らかに一致しない同義語があります。お金と通貨。 類義語も含む一致を見つけるにはどうすればよいですか?

    0

    1答えて

    私はテキストファイルのシーケンシャルバージョンを格納するデータベースを持っています。私は何をしたいのは、ユーザーが任意の二つの履歴ファイル(例えば、バージョン1とバージョン4)を呼び出すとの違いのためにそれらを比較することが可能です: スペルは 新しい単語/新しい文/新しい段落を変更します 基本的にオンラインGITが、テキストファイルではないコードの段落 その他、各種 を移動しました。 私はJav

    0

    1答えて

    電子メールの件名から患者IDを抽出します。私は2つのデータフレームで作業しています.1つはSQLデータベース(電子メールの件名を含む)からの出力を持ち、もう1つは患者情報(病院名と患者ID)を持っています。 患者IDを使用して、最初のデータフレームから件名をスクラブし、その患者に関連する病院に戻したいとします。残念ながら私はデータへのアクセスを提供することはできません。 ## Example Da

    -1

    2答えて

    私の要件では、PythonのWindowsプラットフォームで2つのテキストファイルを1行ずつ照合します。 はFile1: 私の名前はXXX コマンドが正常に完了している例えば、私は、次のテキストファイルを持っています。 私の母の名前は私の携帯電話番号が重い大型トラックが深夜に建物の中に ローリー 教員に赤いリンゴを食べるFile2のクラッシュ12345 あるYYY です: 名前はxxx コマンドで

    13

    2答えて

    私は、ユーザのクエリとテキストを取ることができるJava/Scalaライブラリを探していて、一致するかどうかを返します。 私は情報のストリームを処理しています:Twitter Stream、バッチ処理を使用する余裕がありません。Lucene RAMDiskでインデックスを作成し、後で照会するのではなく、各ツイートをリアルタイムで評価する必要があります。 ANTLRを使用してパーサ/レクサーを作成す

    0

    3答えて

    IN使用して一致した(これらは、などの種のラテン名、Homo_sapiens、Tyranosaurus_rex、ある) 私は別のものを持っていますテーブルにはラテンの名前と種の「一般的な」名前が含まれています。これをクエリして、ラテンの名前の小さな選択(〜140名)を取得できます。私は名前がこの小さな選択に正確に対応している最初のテーブルの行を取得したいと思います。私は小さな選択(のみ140行)を