word-list

0熱

1答えて

だから私は "！"私がしました Yugoslavian! Zambia! Zambian! Zomba! ： Yugoslavian Zambia Zambian Zomba これは私がようにそれを見てみたいものです：私のplacesCapファイルから私のplacesCapExファイル内のすべての単語の最後にこれは、次のようになりますsed 's/$/\!/' Wordlists/placesC

0熱

1答えて

ウェブを掻き集めるワードリスト

私は現在キューファイルに保存されているURLのリストを使って動作するウェブクローラを開発していますが、次のリンクに移動する前にこれらのURLページからすべての単語を削り取る必要があります。キューを作成するには、正しい方向にポイントを設定して、ウェブスクレーパーとcommon.txtを比較して、単語がそこにないことを確認します。追加する前にリストにない場合は私は私のspider.pyでGET_KE

0熱

1答えて

私は単語を含む少なくとも500個の異なるファイル（別の行の各単語）を有する

複数の大きなファイルを重複排除します。問題は、これらのリストは非常に長く（合計50億レコード）、私は各リストをユニークにする問題があるということです。私はファイル名を保持したいと思いますが、同時に、すべてのファイルにユニークなエントリを持っています（マージせずに）。は、これまでのところ私は運がなくて、テーブル内で一意の列（PostgreSQLとSQLiteの）とapp.mergeとCCR、DBな

0熱

2答えて

Crunch：他の変数または入力でプログラムを再実行します。

私はワードリストを作るコードを書いていますが、それを実行させる方法は不思議です。$ var1最初の文字は大文字で入力してください！基本的には、最初の文字を大文字にして、2つの出力、たとえばcharacter1.txt Character2.txtを生成します。何らかの検索を行いましたが、有用なものが見つからなかったため、おそらくIf文またはループでそれを実現できました。まだまだ！ sedは、

0熱

3答えて

単語リストから特定の長さのランダムな単語を取得

word-list.txtにアクセスし、ランダムな単語を引く（単語は改行で区切られます）、簡単なPHP関数を書いています。この単語の最大長は$ maxlengthである必要があります。私がそれを書いた方法は、それは単語を引き出し、長さが長すぎる場合、$ maxlength以下になるまで新しい単語を取得し続けます。私が実行している問題は、スクリプトが最大実行時間に致命的なエラーを返すことです。ここで

0熱

3答えて

1ギガバイト分のテキストを1つのファイルにまとめて、出現数でソートします。

このスクリプトの目標は、テキストファイルでフォルダ全体を取り込み、すべてのファイルの各行を取り込み、すべての一意の行を含むファイルを降順周波数のオーダー。これは、一意の行を見つけるだけでなく、すべてのファイルに各一意の行がどれくらい頻繁に出現するかを検出します。このスクリプトでは、多くのテキストを処理する必要があります。つまり、少なくとも2GBほどであるため、効率的に処理する必要があります。

7熱

4答えて

Javaを使って単語を定義する

単語を定義して単語の起源を見つけることができるJavaのAPIがあるのだろうかと思っていました。私はしばらく前にこれを探して "apache commons"を見たことを覚えていますが、わかりません。基本的に、ユーザーは単語「オーバーフロー」を入力すると、プログラムはその単語を定義することができます。だから私は単語を定義し、単語の起源を見つけることができるAPIを探しています。だから、 "rec

2熱

1答えて

UIMA RUTAの単語リスト一致の問題

UIMA RUTA 2.6.0を使用していくつかのマルチワードトークンに一致させようとしています。お互いに部分的に等しいいくつかのフレーズがあります。 g。私は同じファイルに以下のエントリを持っています： "を含む"、 "含む"、 "これで"、 "に"。私の入力ファイルには次の文章があります： "1."代理人または従業員には取締役が含まれています... "。明らかに、「にはが含まれています」があ

-3熱

1答えて

単語ゲームの無料単語リスト

私は英語で単語ゲームを構築しています。ユーザーが入力した単語を検証するのに役立つ無料のサービスをダウンロードして使用できる無料の単語リストがありますか？