similarity

    3

    1答えて

    私は書籍の名前のリストを著者と一緒に数多く持っています(ISBN番号なし)。私は本のユニークなエントリを含む単一のリストを維持し、すべての本の重複したエントリを削除したい。 私が直面している問題は、異なるリストが本のエントリを格納するために異なる規則に従うことがあるということです。たとえば、リストには著者名がlast namefirst nameという規則で格納されていてもよく、別のリストでは、そ

    1

    3答えて

    私は2つの長い文字列を入力できる良いオンライン文字列チェックツールを探しています。相違点がどこにあるのかがわかります。文字列の入力時に各文字の下にインデックスが表示され、エスケープされた文字が正しく処理され、/ 0が2つではなく1つのスペースしか取らないようなツールがあれば、それはいいかもしれません。 誰もそのようなツールを知っていますか?それは文字列の検証に大きく役立ちます。

    2

    1答えて

    私は最近私がリビジョン管理下に置いた私のファイルの修正を受けましたが、この修正されたファイルがどのコミットに基づいているのかはわかりません。 したがって、特定のファイルを変更するコミットが編集されたバージョンとの違いが最も少ないかどうかを判断する方法はありますか?

    1

    1答えて

    テキスト(記事)(例:スポーツ、経済)、文字列を選択したいと思います。関数similar_text()などとの最良の方法があるかどうかを知りたいと思います。私はテキストを比較する必要があります。 1つの記事はカテゴリに割り当てるべき説明です。 2番目のテキストは実際にはカテゴリを説明するすべてのキーワードを含むテキストです。類似性の割合が与えられた2つのテキストを比較する。 特定のカテゴリと最も類

    3

    1答えて

    Hy男! topics (id*, title, body) tags (id*,name) topic_tags (topic_id,tag_id) すべてのトピックは、いくつかのタグを持っています 私は3つのテーブルを持っています。私はタグにだけ基づいて(トピックのタイトルと本文に基づいていない)、「最も関連性の高い」トピックを別のものに見たいと思っています。 2つのトピック

    1

    1答えて

    私はそこに2つの有向パスを持つ有向グラフを持っています。 2つのパス間の類似性を判断するアルゴリズムが必要です。 This postは、近似類似性を決定するためにLevenshtein distanceを使用して言及しています。私はまた、Hamming distanceが同様の指標を使用していることを認識しています。 私の質問は: どのように2つのパスが互いに平行を実行ケースを処理します。つまり、

    1

    1答えて

    のクラスタのタイトル(クラスタの中心)を選択しますタイトルは'黄色の熟したバナナ'です。 現在のところ、SQL GROUP BYの助けを借りて、最も一般的なものを選択するか、またはネクタイの場合は最短の名前を選択するという簡単なヒューリスティックを使用しています。私のデータには大量のクラスタが含まれており、頻繁に変更され、新しいフルーツがクラスタに追加または削除されるたびに、クラスタのタイトルを再

    6

    5答えて

    単語(例:Apple)を処理してテキストを処理したいのですが、関連する用語を考えてみたいと思います。アップル用とiPod、iPhone、Macは「アップル」に関連した用語であることがわかります。 これを解決する方法上の任意のアイデア?AIのすべてと同様に

    7

    2答えて

    2つの文字列sとtが指定されています。私はsの各部分文字列をtに編集距離(Levenshtein距離)で見つける必要があります。実際には、それぞれiの位置をsに知っておく必要があります。位置で開始されたすべての部分文字列の最小編集距離はどれくらいですか?例えば : t = "ab" s = "sdabcb" そして、私のようなものを取得する必要があります: {2,1,0,2,2} 説明:

    5

    2答えて

    MySQLデータベースに格納されたテキストの数に対してフォーム経由で提出されたテキスト間の類似率をチェックするためのMySQLコードが必要です。 私はPHPのsimilar_text()のように機能するMySQLストアドプロシージャを探しています。すでにMySQL Levenshteinの距離手順がありますが、それだけでは十分ではありません。 ユーザがテキストを送信すると、アルゴリズムは、提出され