2016-06-20 5 views
0

パーサーnpm HTML-TO-TEXTを使用して、特定のディレクトリからテキストを抽出しようとしています。私はテキストを取得することができますが、シェルを使用して私はそれを得ることができません。ここ は、私は、このシェルスクリプトを修正するためにいくつかのいずれかを助けることができるnpmパーサー "html-to-text"がシェルスクリプトで動作しない

#!/bin/sh 
    for i in `ls -a *.html` 
    do 
    s=$i 
    fname=${s##*/} 
    me=${fname%.*} 
    text=$me+".txt" 
    cat $i |html-to-text $i >$text 
    sed -i.bak '/[*]/ !d' $text 
    sed -i.bak -e 's/*//g' $text 
    done 

を書いた私のシェルスクリプトです。

+0

これは私にとって多くのコードのように聞こえる。ここに根底にあるアイデアは何ですか?私はコマンドの半分を削除できると確信しています – fedorqui

+0

なぜあなたは 'cat $ i | html2txt $ i> $ text'となります。確かに同じファイルを2回渡しています。 'cat'は通常必要ありません。 'html2text" $ i ">" $ text "'を試してください(まれな場合を除いて、var名をdbl-quoteするのが良い方法です)。がんばろう。 – shellter

+0

そしてS.O. 'f in * .htmlのために説明します。 doは十分であるはずです。がんばろう。 – shellter

答えて

0

私はテキストを取得できますが、シェルを使用しています。私は受け入れることができません 。 sed -i.bak '/[*]/ !d' $text

あなたは*が含まれていない$textからすべての行を削除します。おそらくあなたが望むものではないでしょう。

関連する問題