word-list

    0

    1答えて

    だから私は "!"私がしました Yugoslavian! Zambia! Zambian! Zomba! : Yugoslavian Zambia Zambian Zomba これは私がようにそれを見てみたいものです:私のplacesCapファイルから私のplacesCapExファイル内のすべての単語の最後に これは、次のようになりますsed 's/$/\!/' Wordlists/placesC

    0

    1答えて

    私は現在キューファイルに保存されているURLのリストを使って動作するウェブクローラを開発していますが、次のリンクに移動する前にこれらのURLページからすべての単語を削り取る必要があります。キューを作成するには、正しい方向にポイントを設定して、ウェブスクレーパーとcommon.txtを比較して、単語がそこにないことを確認します。追加する前にリストにない場合は 私は私のspider.pyでGET_KE

    0

    1答えて

    複数の大きなファイルを重複排除します。問題は、これらのリストは非常に長く(合計50億レコード)、私は各リストをユニークにする問題があるということです。私はファイル名を保持したいと思いますが、同時に、すべてのファイルにユニークなエントリを持っています(マージせずに)。 は、これまでのところ私は運がなくて、テーブル内で一意の列(PostgreSQLとSQLiteの)とapp.mergeとCCR、DBな

    0

    2答えて

    私はワードリストを作るコードを書いていますが、それを実行させる方法は不思議です。$ var1最初の文字は大文字で入力してください! 基本的には、最初の文字を大文字にして、2つの出力、たとえばcharacter1.txt Character2.txtを生成します。 何らかの検索を行いましたが、有用なものが見つからなかったため、おそらくIf文またはループでそれを実現できました。まだまだ! sedは、

    0

    3答えて

    word-list.txtにアクセスし、ランダムな単語を引く(単語は改行で区切られます)、簡単なPHP関数を書いています。この単語の最大長は$ maxlengthである必要があります。私がそれを書いた方法は、それは単語を引き出し、長さが長すぎる場合、$ maxlength以下になるまで新しい単語を取得し続けます。私が実行している問題は、スクリプトが最大実行時間に致命的なエラーを返すことです。ここで

    0

    3答えて

    このスクリプトの目標は、テキストファイルでフォルダ全体を取り込み、すべてのファイルの各行を取り込み、すべての一意の行を含むファイルを降順周波数のオーダー。 これは、一意の行を見つけるだけでなく、すべてのファイルに各一意の行がどれくらい頻繁に出現するかを検出します。 このスクリプトでは、多くのテキストを処理する必要があります。つまり、少なくとも2GBほどであるため、効率的に処理する必要があります。

    7

    4答えて

    単語を定義して単語の起源を見つけることができるJavaのAPIがあるのだろうかと思っていました。私はしばらく前にこれを探して "apache commons"を見たことを覚えていますが、わかりません。 基本的に、ユーザーは単語「オーバーフロー」を入力すると、プログラムはその単語を定義することができます。だから私は単語を定義し、単語の起源を見つけることができるAPIを探しています。だから、 "rec

    2

    1答えて

    UIMA RUTA 2.6.0を使用していくつかのマルチワードトークンに一致させようとしています。お互いに部分的に等しいいくつかのフレーズがあります。 g。私は同じファイルに以下のエントリを持っています: "を含む"、 "含む"、 "これで"、 "に"。 私の入力ファイルには次の文章があります: "1."代理人または従業員には取締役が含まれています... "。明らかに、「にはが含まれています」があ

    -3

    1答えて

    私は英語で単語ゲームを構築しています。ユーザーが入力した単語を検証するのに役立つ無料のサービスをダウンロードして使用できる無料の単語リストがありますか?