tokenize

-1熱

1答えて

こんにちは私はCでクラス用のlc3アセンブラ（??）を書くはずですが、私はトークナイザを書いていませんでした。私のセグメンテーションの誤り。最初の行の後に。 \ n \ rと考慮してください。そして新しい行はが英数字または、または間違ったスペース以外を検討し、コメントをスキップする（初めてのポスターがところで。本当にここに人を愛する！うまくいけば、いつか貢献する十分得られます！）ありがとうご

0熱

1答えて

スタンフォードnlpでのNERモデルのトレーニング

私はスタンフォードコアNLPで遊んでいます。自分のNERモデルを訓練したいと思っています。 SOと公式ウェブサイトのフォーラムから、そうするためにプロパティファイルを使うことが記述されています。私はAPIを介してどのようにしますか？私はプロップのファイルを追加します Properties props = new Properties(); props.setProperty("annotator

0熱

2答えて

スキャナーを1行に複数のトークンを使用するより良い方法ですか？

私は、キー、スペース、数字、そして改行で構成される行でファイルを解析しようとしています。私のコードは動作しますが、私の匂いはしません。スキャナを使用するより良い方法はありますか？特に、私はScan（）をfor-loopの中に何も保護せずに持っているのが好きではありません。 func TestScanner(t *testing.T) { const input = `key1 6212

1熱

1答えて

検索トークンの色

私はbootstrap検索field+tokeninputを使用しています。私はさまざまな色のトークンを取得し、各トークンにidを追加しようとしています。私はこのブートストラップ検索フィールド使用しています：Example of what I am trying to achieve ：今私はちょうどこのように、トークン入力上の定義済みの色を設定する必要があり、すべてが正常に動作している、Se

1熱

2答えて

文字列内の記号を確認する

私は単純なDSLを実装しています。私が手にどこ def tokenize(txt): ... return fmt, vars ：私は次の関数を実装する必要が { 'name': 'John', 'city': 'Paris', 'more': 'xxx', 'data': 'yyy', ... } ：私は、次の入力文

-1熱

3答えて

文のリストからトークンを作成すると、単語の代わりに文字が返されます

from nltk.tokenize import sent_tokenize text = open(path).read().lower().decode("utf8") sent_tokenize_list = sent_tokenize(text) tokens = [w for w in itertools.chain(*[sent for sent in sent_token

0熱

1答えて

Solr StandardTokenizerが間違った番号を作成する

私のSolrコアとStandardTokenizerFactoryに問題があります。数値ディメンションを作成する必要がありますが、StandardTokenizerが間違った数値を作成しています。私は "spanplattenschraube 4,5 50"を探しています。私のSolrの管理分析ではトークナイザは、したがって、最初の結果として、私は、ドキュメントを取得、この数字から「4.0」

3熱

0答えて

OpenNLP Tokenizerの丸いブラケット

私は文字列をトークンに変換するのにOpenNLP javaを使用しています。しかし、私はラウンドブラケットが正しく識別することができないことがわかります。コード私が使用しています。たとえば ` InputStream is = new FileInputStream("en-token.bin"); TokenizerModel model = new TokenizerModel(is);

1熱

1答えて

弾性検索の区切り文字に基づいて文字列をトークン化

36-3031.00|36-3021.00〜36-3031.00〜36-3021.00の文字列を|の区切り文字でトークン化する必要があります。私はこのように試してみましたが、 PUT text { "test1": { "settings": { "analysis" : { "tokenizer" : { "pipe_tokeniz

-1熱

1答えて

私のコードでこのjavaトークナイザエラーを修正しましたが、キーワードのテキスト文書を解析しようとしましたが、このままでした

この入力リーダーをパーサークラスのJavaに作成しました。。 1）しかし、私は次の論理エラーがあります。この行に複数のマーカーがあります。 - StringTokenizerは私は配列は私の配列リストラインで解決することはできません持っているタイプにを解決することはできません - StringTokenizerは、型にを解決することはできません。 2）エラーが修正された場合、パーサーが