2009-08-01 9 views
1

私はdelicious.com/popularのRSSフィードを管理しています。しかし、最近、アジアのページが増えています。私はアジア言語を理解していないので、私は何とかフィードからそれらをフィルタリングして、自分自身で時間を節約したいと思います。RSSフィードからアジア言語をフィルタリングする方法は?

私はYahoo pipesを使用して何かを調理しようとしていますが、動作させることができませんでした。

誰でもこの作品を作成する方法はありますか?

答えて

1

私はパイプのソースは、すべての情報を持っていますが、キービット正規表現^[A-Za-z 0-9 \.,\?'""[email protected]#\$%\^&\*\(\)-_=\+;:<>\/\\\|\}\{\[\]でフィルタを実行しているhttp://pipes.yahoo.com/pipes/pipe.info?_id=yJh1aRp_3hGaPi23tPvyrQ

でいくつかの運を持っていた〜] + $ `。

タイトルの標準ASCII以外を使用するフィードを除外します。残念なことに、これは "résumé"のような単語もフィルタリングすることを意味しますが、あなたが知っている言語の英字以外の一般的な文字を含む正規表現を調整するのは簡単です。

+0

ありがとうございます!これは私のためにうまくいくでしょう。 – MvdD

0

文字のX%以上が理解できない言語のスクリプトに割り当てられているコードブロックに含まれていないタイトルをスキップしたいと思うかもしれません。たとえば、ギリシア語、ロシア語、アラビア語、ヘブライ語、アルメニア語、中国語、日本語、韓国語、インド語などを読むことができない場合、文字の10%以上がU + 0000〜 U + 0233。これはあなたにラテンのアルファベットを残します。 10%のような余白を残すという考えは、句読点のためです。また、技術記事では、ベースアルファベットにないシンボルを使用することがあります。

関連する問題