2009-08-27 6 views
2

誰かが数百語の長さのテキストを取り、キーワードの配列を生成する利用可能なPHP関数を知っていますか?つまり最も重要な、頻繁に発生するユニークな用語そのような機能は存在しない(それがなかった場合は魔法のだろう)が、何かを始めるために、あなたは次のことを行うことができ フィリップKeywords from string

答えて

7

ありがとう:

  1. Splitスペースのテキスト、 が生産単語の配列。
  2. stop-wordsと 不要な句読点と記号(おそらくregular expressions - preg_replaceを参照)を削除します。
  3. は($words[0]ので最も頻繁occuring単語、すなわち、最初のオフセットである)、残りのアレイ内 各単語、 の出現箇所の数をカウントし、周波数 のためにそれを並べ替えます。
  4. 重複を削除するためにarray_uniqueを使用すると、 出現頻度順の のユニークキーワードが作成されます。
+0

あなたは私にそれを打つ。 –

0

このような何かがトリックを行う場合があります。また

$thestring = 'the most important, frequently occuring unique terms?'; 
$arrayofwords = explode(" ", $thestring); 
echo print_r($arrayofwords); 

空白の代替カンマ「」かもしれないので、あなたはクリーンなキーワードを取得します。

$thestring = 'the most important, frequently occuring unique terms?'; 
$cleaned_string = str_replace(",", "", "$thestring"); 
$arrayofwords = explode(" ", $cleaned_string); 
echo print_r($arrayofwords);