text-parsing

    0

    1答えて

    私はtextfsmがテキストファイルを解析する良い方法だと理解しましたが、私はそれが1行でデータを解析できることを理解しました。私の質問は、複数の行にまたがるテキストを解析する方法です。一行ではありませんどのように私は報告者や市民権や組織の場所の名前を解析する上で、テキスト、中 <Page> CUSIP No. 123456 13G Page 2 of 10 Pages -

    0

    1答えて

    私は単位をインチに変換するはずのこのperlプログラムを持っています。しかし、ループ中に変数を出力することはありません。それはちょうど、標準は「に等しく、」印刷し、$ユニット2は、ここに私のコードここ #!/usr/bin/perl #usage: perl convert.pl use Path::Class; use warnings; use autodie; # die if p

    1

    1答えて

    StackoverflowからJsoupを使用してウェブサイトを簡単に解析できます。 たとえば、私はウィキペディアのウェブサイトからnewsHeadlinesを解析するために次のコードを書くことができます。 Document doc = Jsoup.connect("http://en.wikipedia.org/").get(); Elements newsHeadlines = doc.se

    1

    3答えて

    目的:docker psの対話型バージョンを作成しようとしています。が存在することになる CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES 1. bf4a9c7de6bf app_1 "docker-php-entryp..." 7 days ago Up About an hour

    -2

    1答えて

    私は、完全に構造化された、私のアプリが必要とする単一のデータテーブルを持っています。 これは、数千の行、スペースで区切られた3つの列(読み込み元のテキストファイル)で構成されており、特定の優先度を割り当てる必要があります。 この優先度はintとして格納され、変更されます。 私は全体をメモリに保存することを考えました(それはかなり短い文字列です)。そして、セッションの最後に更新されたint値をテキス

    0

    1答えて

    1つのパス(ファイル全体)で解析するときにうまくいく文法があります。 ここで、解析をコンポーネントに分割したいと考えています。そして、パーサーをサブルールで実行します。私は、私は、次のルールに表示されますサブルールを解析する他の人を想定して問題に遭遇した:上記のルールは、すべてが正常に動作するためにEOF解析し、トップレベルの開始規則から解析され thing : LABEL? THING THIN

    -1

    1答えて

    JSON文字列を解析してカンマで区切って書いていますが、Freeにもコンマが含まれています。さまざまな組み合わせを試しましたが成功できませんでした。 私はこれをSparkストリーミングの一部として使用していますので、これらのデータがランダムなソースからランダムに来たためJSONパーサーを使用できませんでした。したがって、分割してキーと値のペアとしてテキストを取得することが分割を使用する理由でした。

    0

    1答えて

    私はこのコードを持っていますが、実行しようとするとこのエラーが発生します。 Exception in thread "main" java.lang.NumberFormatException: For input string: "1" すべての行には数字と電子メールが含まれているので、各行の最初の文字が数字になります。プログラムは、このライン int sor = Integer.parseIn

    -1

    2答えて

    いくつかの.datファイルをプロットするための小さなPythonスクリプトを作成します。そのためにはまずファイルを処理する必要があります。 .datファイルは次のようになります。 (Real64 (numDims 1) (size 513) (data [ 90.0282291905089 90.94377050431068 92.31708247501335 93.3852140

    -2

    1答えて

    私は充てんされたデータinitを持つ連邦のpdf形式をいくつか持っています。例えばi765と言いますが、私はこの書式のデータをテキスト形式で入手できます。最小限の解析でこのフォームからデータを抽出するにはどうすればよいですか。どのように "違い"を識別するスクリプトを書くことができますが、それはそれだけで充足された情報です。例えばのために :行が含まれている場合.. SSN:(空白)とフォームに記