text-parsing

    0

    1答えて

    I 'はここ要件が列「C」内のセル内のすべての数字の合計を取得し、列に対応するセルの値を置くことである alt text http://i43.tinypic.com/wsnxci.jpg (下図参照)Excelシートを有しますB '(私の例では、1 + 0.25 + 0.25 + 1 = 2.5)。列 'C'の値は、チームによって与えられた入力に基づいて動的に変化する可能性があります。要件は、

    12

    6答えて

    私はAWKを使うことができますが、私はWindowsの箱に入っています。私はAWKを持っていないかもしれない他の人のための機能を作っています。私はCプログラムを書くことができることも知っていますが、私が作っている小さなVimユーティリティのために何かを維持しコンパイルする必要はありません。 元のファイルは THE DAY WAS LONG THE WAY WAS FAST かもしれないし、そ

    12

    3答えて

    私はこの文字列を持っている: %{Children^10 Health "sanitation management"^5} をそして、私はハッシュの配列にこれをトークン化するためにそれを変換したい: [{:keywords=>"children", :boost=>10}, {:keywords=>"health", :boost=>nil}, {:keywords=>"sanitation

    1

    1答えて

    私はいつも、フォーラムやブログのようなWebソフトウェアを書くことに興味がありました。しかし、最近、私はPHPのために "PHP BBCode parser -PEAR"をテストし、いくつかのテストをすると、非効率的な混乱を招くか、XSSの穴があちこちにあるコードが貧弱になることに気づきました。 貧弱なBBCodeパーサの前述の例を取り上げて、XSSをどのように避けますか?リンクを扱うための典型的

    0

    4答えて

    正規表現を使用して、 FROM codes WHERE FieldName='ContactMethod' and IsNull(Deactived,'') != 'T' を SELECT FieldDescription,FieldValue FROM codes WHERE FieldName='ContactMethod' and IsNull(Deactived,'') !=

    4

    3答えて

    RSS 2.0フィードのタイトルタグを、そのフィードの各エントリの3つの異なる変数に解析しようとしています。あなたが見ることができるように、ので私は含ま feed = getfeed("http://www.tourfilter.com/dallas/rss/by_concert_date") for item in feed: print repr(item.title[0:-1])

    5

    4答えて

    OCRライブラリとJavaを使用してPDFからテキストを抽出しようとした人はいますか?テキスト抽出のための最も信頼性の高いライブラリは何でしたか?私が見たアプローチ(tesseract、GOCR)のほとんどは、いくつかのJNIコードを書く必要があるCライブラリです。 私はpdfboxをよく知っています。これは現在バージョン0.8.xのApacheインキュベータープロジェクトですが、テキスト抽出は必