tokenize

    -1

    1答えて

    こんにちは私はCでクラス用のlc3アセンブラ(??)を書くはずですが、私はトークナイザを書いていませんでした。私のセグメンテーションの誤り。最初の行の後に。 \ n \ rと考慮してください。そして新しい行は が 英数字または、または間違ったスペース以外を検討し、コメントをスキップする(初めてのポスターがところで。本当にここに人を愛する!うまくいけば、いつか貢献する十分得られます!) ありがとうご

    0

    1答えて

    私はスタンフォードコアNLPで遊んでいます。自分のNERモデルを訓練したいと思っています。 SOと公式ウェブサイトのフォーラムから、そうするためにプロパティファイルを使うことが記述されています。私はAPIを介してどのようにしますか?私はプロップのファイルを追加します Properties props = new Properties(); props.setProperty("annotator

    0

    2答えて

    私は、キー、スペース、数字、そして改行で構成される行でファイルを解析しようとしています。 私のコードは動作しますが、私の匂いはしません。スキャナを使用するより良い方法はありますか?特に、私はScan()をfor-loopの中に何も保護せずに持っているのが好きではありません。 func TestScanner(t *testing.T) { const input = `key1 6212

    1

    1答えて

    私はbootstrap検索field+tokeninputを使用しています。 私はさまざまな色のトークンを取得し、各トークンにidを追加しようとしています。 私はこのブートストラップ検索フィールド使用しています:Example of what I am trying to achieve :今私はちょうどこのように、トークン入力上の定義済みの色を設定する必要があり、すべてが正常に動作している、Se

    1

    2答えて

    私は単純なDSLを実装しています。私が手にどこ def tokenize(txt): ... return fmt, vars :私は次の関数を実装する必要が { 'name': 'John', 'city': 'Paris', 'more': 'xxx', 'data': 'yyy', ... } :私は、次の入力文

    -1

    3答えて

    from nltk.tokenize import sent_tokenize text = open(path).read().lower().decode("utf8") sent_tokenize_list = sent_tokenize(text) tokens = [w for w in itertools.chain(*[sent for sent in sent_token

    0

    1答えて

    私のSolrコアとStandardTokenizerFactoryに問題があります。 数値ディメンションを作成する必要がありますが、StandardTokenizerが間違った数値を作成しています。 私は "spanplattenschraube 4,5 50"を探しています。 私のSolrの管理分析ではトークナイザは、したがって、最初の結果として、私は、ドキュメントを取得、この数字から「4.0」

    3

    0答えて

    私は文字列をトークンに変換するのにOpenNLP javaを使用しています。しかし、私はラウンドブラケットが正しく識別することができないことがわかります。 コード私が使用しています。たとえば ` InputStream is = new FileInputStream("en-token.bin"); TokenizerModel model = new TokenizerModel(is);

    1

    1答えて

    36-3031.00|36-3021.00〜36-3031.00〜36-3021.00の文字列を|の区切り文字でトークン化する必要があります。 私はこのように試してみましたが、 PUT text { "test1": { "settings": { "analysis" : { "tokenizer" : { "pipe_tokeniz

    -1

    1答えて

    この入力リーダーをパーサークラスのJavaに作成しました。 。 1)しかし、私は次の論理エラーがあります。 この行に複数のマーカーがあります。 - StringTokenizerは私は配列は私の配列リストラインで解決することはできません持っているタイプ に を解決することはできません - StringTokenizerは、型 に を解決することはできません。 2)エラーが修正された場合、パーサーが